Approche de la linguistique de corpus. Aspects techniques (recueil de données, méthodes d'acquisition de données, enregistrement). Aspects légaux et éthiques (protection des données personnelles, anonymisation, archivage). Outils automatiques pour la constitution de corpus. Annotation et évaluation (guides et schémas d'annotation, réplicabilité et mesures d'accord inter-annotateur).