Système de stockage Apache Cassandra 3
Le système de stockage Apache Cassandra 3 est un système de stockage Key-Value distribué open source. Il a été initialement développé par Facebook pour stocker des quantités de données particulièrement importantes.
Principales caractéristiques
1. Distribué
La principale caractéristique de Cassandra est qu'il ne s'agit pas d'une base de données unique, mais d'un service réseau distribué composé d'un groupe de nœuds de base de données. Les opérations d'écriture sur Cassandra sont répliquées sur d'autres nœuds, tandis que les opérations de lecture sont acheminées vers un nœud spécifique pour la lecture.
2. Structuration basée sur des colonnes
Cassandra utilise un modèle de données basé sur des colonnes, similaire au BigTable de Google. Ce modèle permet aux utilisateurs de stocker et d'interroger les données selon leurs besoins sans avoir à définir l'intégralité de la structure des données à l'avance.
3. Haute extensibilité
Cassandra est hautement évolutif et des nœuds peuvent être facilement ajoutés pour étendre la capacité du cluster sans redémarrer aucun processus, modifier les requêtes des applications ou migrer manuellement les données.
Fonctionnalités de Cassandra par rapport à d’autres bases de données
Cassandra est une base de données hybride non relationnelle, similaire à BigTable de Google. Elle a des fonctions plus riches que Dynomite (système de stockage distribué de valeurs-clés), mais son support n'est pas aussi bon que le stockage de documents MongoDB (entre une base de données relationnelle et une base de données non relationnelle). base de données relationnelle). Produit open source parmi les bases de données relationnelles, c'est la plus riche en fonctionnalités parmi les bases de données non relationnelles et est la plus similaire à une base de données relationnelle. La structure de données prise en charge est très lâche et est un format bjson de type json, donc. il peut stocker des types de données plus complexes).
Cassandra a été initialement développé par Facebook et est ensuite devenu un projet open source. Il est très adapté aux besoins de bases de données dans le cloud computing social en réseau. Il est basé sur Dynamo, entièrement distribué et propriétaire d'Amazon, et combine le modèle de données basé sur la famille de colonnes de Google BigTable. Le stockage décentralisé P2P peut être appelé Dynamo 2.0 à bien des égards.
Par rapport à d'autres bases de données, Cassandra présente les fonctionnalités exceptionnelles suivantes :
1. Flexibilité du schéma : avec Cassandra, tout comme avec un magasin de documents, vous n'avez pas besoin de déterminer à l'avance les champs d'un enregistrement. Vous pouvez ajouter ou supprimer des champs à volonté pendant que le système est en cours d'exécution. Il s’agit d’un énorme gain d’efficacité dans les déploiements à grande échelle.
2. Véritable évolutivité : Cassandra est évolutive horizontalement au sens pur du terme. Pour ajouter plus de capacité au cluster, pointez simplement vers une autre machine. Vous n'avez pas besoin de redémarrer des processus, de modifier les requêtes d'application ou de migrer manuellement des données.
3. Identification de plusieurs centres de données : vous pouvez ajuster la disposition des nœuds pour éviter la panne d'un centre de données. Le centre de données de sauvegarde contiendra au moins une copie complète de chaque enregistrement, garantissant ainsi la sécurité des données.
Autres fonctions
En plus des principales fonctionnalités mentionnées ci-dessus, Cassandra propose également quelques autres fonctionnalités :
1. Requête de plage : si vous ne souhaitez pas effectuer toutes les requêtes de valeur de clé, vous pouvez définir la plage de clés à interroger.
2. Structure de données de liste : en mode mixte, des super colonnes peuvent être ajoutées à la structure de données à cinq dimensions. Ceci est très pratique pour l’indexation par utilisateur.
3. Opérations d'écriture distribuées : Cassandra vous permet de lire ou d'écrire de manière centralisée n'importe quelle donnée n'importe où, à tout moment, sans aucun point de défaillance unique.
Résumer
Apache Cassandra 3 est un puissant système de stockage de valeurs-clés distribué open source qui offre une évolutivité, une flexibilité de schéma et une fiabilité élevées, ce qui le rend idéal pour les applications qui doivent stocker et traiter de grandes quantités de données.