Система хранения Apache Cassandra 3
Система хранения Apache Cassandra 3 — это распределенная система хранения данных с открытым исходным кодом. Первоначально он был разработан Facebook для хранения особенно больших объемов данных.
Основные особенности
1. Распределенный
Основная особенность Cassandra заключается в том, что это не отдельная база данных, а распределенный сетевой сервис, состоящий из группы узлов базы данных. Операции записи в Cassandra реплицируются на другие узлы, а операции чтения направляются на определенный узел для чтения.
2. Структурирование по столбцам
Cassandra использует модель данных на основе столбцов, аналогичную BigTable от Google. Эта модель позволяет пользователям хранить и запрашивать данные по мере необходимости без необходимости заранее определять всю структуру данных.
3. Высокая растяжимость
Cassandra обладает высокой масштабируемостью, и узлы можно легко добавлять для расширения емкости кластера без перезапуска каких-либо процессов, изменения запросов приложений или переноса данных вручную.
Возможности Cassandra по сравнению с другими базами данных
Cassandra — это гибридная нереляционная база данных, похожая на BigTable от Google. Она имеет более богатые функции, чем Dynomite (распределенная система хранения значений ключей), но ее поддержка не так хороша, как хранилище документов MongoDB (между реляционной базой данных и не-реляционной базой данных). реляционная база данных). Продукт с открытым исходным кодом среди реляционных баз данных, он является наиболее многофункциональным среди нереляционных баз данных и наиболее похож на реляционную базу данных. Поддерживаемая структура данных очень свободна и представляет собой json-подобный формат bjson. он может хранить более сложные типы данных).
Cassandra изначально была разработана Facebook, а позже стала проектом с открытым исходным кодом. Он очень подходит для нужд баз данных в сетевых социальных облачных вычислениях. Он основан на собственной полностью распределенной технологии Dynamo от Amazon и сочетает в себе модель данных на основе семейства столбцов Google BigTable. Децентрализованное P2P-хранилище во многих аспектах можно назвать Dynamo 2.0.
По сравнению с другими базами данных Cassandra имеет следующие выдающиеся возможности:
1. Гибкость схемы. С Cassandra, как и с хранилищем документов, вам не нужно заранее определять поля в записи. Вы можете добавлять или удалять поля по своему желанию во время работы системы. Это огромный прирост эффективности при крупных развертываниях.
2. Истинная масштабируемость. Cassandra в чистом смысле горизонтально масштабируема. Чтобы увеличить емкость кластера, просто укажите другой компьютер. Вам не нужно перезапускать какие-либо процессы, изменять запросы приложений или вручную переносить какие-либо данные.
3. Идентификация нескольких центров обработки данных. Вы можете настроить расположение узлов, чтобы избежать сбоя одного центра обработки данных. Резервный центр обработки данных будет содержать как минимум полную копию каждой записи, обеспечивая безопасность данных.
Другие функции
В дополнение к основным функциям, упомянутым выше, Cassandra также предоставляет некоторые другие функции:
1. Запрос диапазона. Если вы не хотите выполнять все запросы значений ключей, вы можете установить диапазон ключей для запроса.
2. Структура данных списка. В смешанном режиме к пятимерной структуре данных можно добавлять суперстолбцы. Это очень удобно для индивидуальной индексации.
3. Распределенные операции записи: Cassandra позволяет централизованно читать или записывать любые данные в любом месте и в любое время, без единой точки отказа.
Подвести итог
Apache Cassandra 3 — это мощная распределенная система хранения данных с открытым исходным кодом, обеспечивающая высокую масштабируемость, гибкость схемы и надежность, что делает ее идеальной для приложений, которым необходимо хранить и обрабатывать большие объемы данных.