NoSQL — Découverte du NoSQL
Prochaines sessions (Boulogne-Billancourt / Paris / classe virtuelle)
Programme
Introduction
- Origine des bases de données
- Les notions de transaction
- Les SGBD
- La standardisation SQL
- L’arrivée de nouveaux besoins : volumes importants liés aux technologies et aux nouveaux usages
- Traitements optimisés de flux de données au fil de l’eau
- Développement des techniques sur différents aspects : stockage, indexation/recherche, calcul
- Définition ETL : Extract Transform Load
Caractéristiques NoSQL
- Structure de données proches des utilisateurs, développeurs: sérialisation, tables de hachage, JSON
- Priorité au traitement du côté client
- Protocoles d’accès aux données, interfaces depuis les langages classiques
- Données structurées et non structurées, documents, images
- Stockage réparti : réplication, sharding, protocole gossip, hachage, …
- Parallélisation des traitements : implémentation de MapReduce
- Cohérence des données et gestion des accès concurrents : “eventual consistancy” et multi-version concurrency control
Principaux acteurs
- Les solutions NoSQL et leurs choix techniques : CouchDB, MongoDB, Cassandra, HBase (Hadoop), ElasticSearch, …
- Démonstrations avec Cassandra et couchDB
- Critères de choix
Mise en oeuvre
- Points à vérifier : méthode d’utilisation des données, format de stockage JSON, XML, choix de la clé, notion de clé composite, …
- Aspects matériels, besoins en mémoire, disques, répartition, …
- Import des données : outils et méthodes selon les moteurs NoSQL
Profils des intervenants
Modalités d'évaluation
Attestation de formation remise à chaque participant.
Démarche qualité
Moyens pédagogiques
Espace de pause.