L'objectif de cette UE est de présenter le domaine du traitement automatique des langues. Il s'agit d'un domaine porteur qui permet de développer des applications innovantes pour traiter le langage humain, telles que les assistants personnels, agents conversationnels, traducteurs automatiques. Chaque module du cours abordera une famille de modèles et/ou applications permettant de résoudre un problème concret du traitement automatique des langues.
- Analyse morphologique et syntaxique (16,7%) : notions élémentaires de linguistique, ambiguïtés, automates finis et grammaires hors contexte pour l'analyse du langage naturel
- Représentation et manipulation de textes (16,7%) : encodage de caractères, segmentation de phrases, tokénisation, loi de Zipf, vocabulaire, TTR.
- Recherche d'informations et classification de textes (16,7%) : vecteurs de co-occurrences, similarité du cosinus, classification de textes, algorithme des k plus proches voisins
- Dictionnaires électroniques (16,7%) : représentation d'informations lexicales, valence verbale, sens des mots, sémantique lexicale
- Analyse morphosyntaxique probabiliste (16,6%) : parties du discours, probabilité conditionnelle, n-grammes, probabilité de séquences, modèle d'étiquetage en parties du discours
- Grammaires logiques (16,6%) : variables, définition de grammaires logiques, unification