S51IN2A2

UE Introduction au traitement automatique du langage

Unité d'enseignement (UE) de 3 crédits

Contenu

L'objectif de ce cours est d'apporter aux étudiants des connaissances fondamentales en traitement automatique des langues (TAL). Le cours abordera des modèles de TAL statistiques classiques. Après un bref rappel de notions de probabilité appliquées aux textes, nous aborderons la représentation de documents, c.-à-d. l'encodage de textes, la tokenisation et la représentation de documents sous la forme vectorielle avec des techniques fondées sur les "sac de mots". Nous étudierons également des modèles distributionnels pour la représentation de mots sous la forme de vecteurs, avec des applications en classification de textes et en similarité de mots. Les modèles de langage fondés sur les n-grammes s'en suivent, avec des applications à la génération de textes. Le dernier sujet abordé ce sont les étiqueteurs fondés sur des machines à état (tels que les modèles de Markov cachés) et leurs applications, par exemple en étiquetage morphosyntaxique.

Volume des enseignements

  • Aucune information disponible

Responsables pédagogiques:

  • BECHET Frederic image adresse mail du personnel amu
  • RAMISCH Carlos image adresse mail du personnel amu

Codes APOGÉE

  • SINBU02L [ELP]

Les formations qui utilisent cet enseignement

Dernière modification éffectué le 23/07/2021 à 11:01