AccueilMasterSciences cognitivesEnseignementsCorpus

Master Sciences cognitivesUE Corpus

Contenu

Approche de la linguistique de corpus. Aspects techniques (recueil de données, méthodes d'acquisition de données, enregistrement). Aspects légaux et éthiques (protection des données personnelles, anonymisation, archivage). Outils automatiques pour la constitution de corpus. Annotation et évaluation (guides et schémas d'annotation, réplicabilité et mesures d'accord inter-annotateur).

Compétences visées

  • Recueillir des données et les annoter dans le but d'une étude linguistique ciblée.
  • Connaître des outils d'aide à la manipulation et l'annotation de données à différents niveaux linguistiques
  • Evaluer la qualité d'un corpus et la qualité et la pertinence de ses annotations

Langue utilisée

Langue principale utilisée par cet enseignement : Français.

Bibliographie

Biber, D., Conrad, S., Reppen, R. (1998) Corpus Linguistics. Investigating

Language Structure and Use. Cambridge : CUP.

Habert, B., Nazarenko, A., Salem, A. (1997) Les linguistiques de corpus, Armand Colin, Paris, 240 pages.

McEnery, T. ; Wilson, A. (2001) Corpus Linguistics. Edinburgh : EUP.

Volume des enseignements

  • Cours magistraux : 24 heures
  • Travaux dirigés : 24 heures

Code APOGÉE

HSLAU06.

Les formations qui utilisent cet enseignement