L'objectif commun des deux UE est de découvrir la notion de données et son exploitation statistique, pour synthétiser l’information qu’elles portent, sous forme de tableaux ou de graphique, et d’identifier les indicateurs pour décrire une variable. Il s’agit également de mettre en place les premiers éléments de la statistique s’appuyant sur une modélisation stochastique, d’introduire les notions de variables aléatoires et de distributions.
Les parties probabilistes se limiteront au cas discret pour rester adapté aux connaissances mathématiques des étudiants.
Partie 1. Données
* Données tabulaires, notion de population, d’échantillon et d’unité statistique, discuter de la représentativité de l’échantillon
* Notion de variable statistique, compréhension et identification du type d’une variable
* Sensibilisation à la qualité des données : valeurs aberrantes, manquantes, doublons
Partie 2. Statistique descriptive univariée
* Effectif, fréquence, densité de fréquence et d’effectif d’une variable statistique
* Indicateurs de tendance centrale, de dispersion et de forme d’une variable statistique : moyenne, médiane, écart-type et variance
* Exploration, présentation et visualisation sous forme de tableaux et de graphiques : regroupement par classes, histogramme, diagramme en barre et diagramme circulaire, diagrammes de Cox
Partie 3. Modélisation probabiliste discrète
* Variable aléatoire comme modélisation d’un potentiel non réalisé
* Loi d’une variable aléatoire et modélisation de la population
* Base de calcul des probabilités : univers, événements, probabilité, règles de calcul, probabilités conditionnelles et indépendance
* Lois usuelles : uniforme, Bernoulli, binomiale, Poisson, géométrique et hypergéométrique
* Espérance et variance