But de ce cours
- Donner une culture générale en TAL
- Savoir mener des expériences en TAL
Plan du cours
Partie 1 : Le langage humain est un signal
- d’un signal de parole à un signal de “mots” : modèles paramétriques/statistiques, canal bruité
- modélisation de la “source” d’un texte par chaîne de Markov
- analyse statistique d’un texte : Loi de Zipf, représentation vectorielle, distance cosine
- Partie 2 : Le langage humain est un système formel
- de la compilation d’un langage de programmation vers la compilation du langage humain
- analyse lexicale, syntaxique, sémantique
- Partie 3 : Le langage humain est à la fois un signal et un système formel
- grammaires probabilistes, tagging syntaxique/semantique - le cas des grands modèles de langue génératifs (chatGPT)
- Mise en pratique
- développement d’un chatbot permettant d’interroger une base de données
- 3 versions pour les 3 “vues” sur le langage
- appliquer un protocole de test et d’évaluation rigoureux ; méthodes d’analyse des résultats