The syllabus will be available soon.
- HDFS. MapReduce. Stockage et calculs distribués. Déploiement d’un cluster.
- Préparation, stockage et traitement des big data : Pandas, Hive and Pig
- Data visualisation avec matplotlib & seaborn
- Alternatives : solutions propriétaires, bases NoSQL, ElasticSearch