L’analyse de données peut être divisée en deux parties : les statistiques descriptives et les statistiques inférentielles. La première partie est consacrée aux statistiques descriptives en commençant par les bases avant d’approfondir ce domaine et de s’orienter vers la fouille de données et les arbres de décisions. La seconde partie est dédiée aux statistiques inférentielles notamment à l’apprentissage automatique et profond. Les notions et théories de l’apprentissage introduiront l’utilisation de certaines librairies classiques de l’apprentissage automatique et profond comme Scikit-Learn et Tensorflow.
- Statistiques descriptives :
- Statistiques de base, lois de distribution.
- Fouille de données et arbre de décision.
- Représentations graphiques de statistiques.
- Statistiques inférentielles :
- Apprentissage Automatique
- Apprentissage profond
Logiciels utilisés : R/Rstudio pour le premier chapitre et certaines librairies classiques de l’apprentissage en Python de l’apprentissage comme Scikit-Learn et Tensorflow pour la seconde partie.
Des connaissances en Python seront utilisées.