L’organisation des flux au sein de CASSANDRA (Commitlog, Ecriture, Lecture, Replication…) est le mortier des fondations du SGBD. Vous avez été nombreux à me demander quelques explications sur le fonctionnement interne de CASSANDRA ainsi que la stratégie à adopter pour déployer un cluster de plusieurs noeuds. Il y a certaines zones d’ombres qui me reste à étudier (les relations entre «JVM» < => «Commitlog» < => Réplication) pour une parfaite compréhension du workflow d’enregistrement de la data et de sa réplication au sein d’un cluster. Si vous avez des précisions à apporter à ce billet ou même des corrections, vos recommandations et notes seront très très appréciés.
-
Les flux dans CASSANDRA peuvent être séparés en deux grandes catégories à savoir :
- Flux datas : enregistrement et lecture de la donnée,
- Flux de services : communication entre les noeuds, gestion du partitionnement, stratégie de la réplication.
Nous allons aborder dans ce billet les flux datas : écriture et lecture de la donnée.