Objectifs de l'enseignement :
Le contexte actuel, caractérisé par un flux continu de données dans tous les domaines, qui génère une quantité énorme d’information, la plupart du temps non structurée, relève le besoin d’un traitement efficace de ces données d’une volumétrie élevée et d’une structure flexible. La partie Big Data de ce module vise à introduire les concepts de base du NoSQL, qui représente une solution éventuelle pour le traitement des données massives, avec une structure flexible. Les principes et les définitions concernant NoSQL sont introduits à partir de parallèles et de comparaisons avec le SQL. La modélisation et le langage de requêtes NoSQL sont présentés. L’objectif principal est de donner aux étudiants les éléments nécessaires afin de pouvoir choisir entre une approche SQL et une approche NoSQL et encore plus, dans le cas d’un choix pour NoSQL, de pouvoir choisir entre les quatre types de structures NoSQL. En termes d’outils formels et technologies, le focus sera fait sur mongoDB et neo4j.
Plan du cours :
- SQL vs. NoSQL : Introduction, principes, types de NoSQL
- Premiers pas avec MongoDB : environnement, console, PyMongo
- Premiers pas avec neo4j : environnement, visualisation
- NoSQL et MapReduce : principes, MapReduce avec MongoDB