La gestion, l’exploration, la visualisation et l’analyse des données sont au coeur de la « data science » (science des données) en plein essor à travers l’ensemble des sciences expérimentales. En biologie, l’interprétation des grands jeux de données produits par les méthodes « omiques » est largement dépendante de bio-analystes maîtrisant les outils spécifiques permettant de convertir des données souvent complexes et multidimensionnelles, en des représentations permettant de repérer des signaux afin d’en tirer des connaissances. Cet enseignement a pour objectif d’initier les étudiants à l’exploration visuelle de données omiques grâce au logiciel R Studio, logiciel libre de référence dans le monde professionnel. Les compétences acquises sont transverses et déployables dans divers domaines de la biologie, et plus généralement dans tous les domaines des sciences et techniques où interviennent l’analyse de données. L’enseignement est résolument tourné vers l’apprentissage par la pratique : chaque étudiant mettra directement en œuvre le chargement d’un jeu de données complet (données numériques et métadonnées associées), l’exploration, la filtration / normalisation, puis l’exploitation de librairies graphiques dédiées omiques pour produire des visualisations complexes de qualité professionnelle publiables. Seront aussi utilisées les méthodes populaires de l’univers R permettant d’associer automatiquement les visualisations avec les commentaires, la documentation, les références et les matériels et méthodes sous-jacents, proposant ainsi la maîtrise d’une approche intégrée pour contribuer aux enjeux majeurs de la science ouverte et reproductible.