ระบบจัดเก็บข้อมูล Apache Cassandra 3
ระบบจัดเก็บข้อมูล Apache Cassandra 3 เป็นระบบจัดเก็บข้อมูลคีย์-ค่าแบบโอเพ่นซอร์สแบบกระจาย เดิมได้รับการพัฒนาโดย Facebook เพื่อจัดเก็บข้อมูลจำนวนมากเป็นพิเศษ
คุณสมบัติหลัก
1. กระจาย
คุณสมบัติหลักของ Cassandra คือไม่ใช่ฐานข้อมูลเดียว แต่เป็นบริการเครือข่ายแบบกระจายที่ประกอบด้วยกลุ่มของโหนดฐานข้อมูล การดำเนินการเขียนไปยัง Cassandra จะถูกจำลองไปยังโหนดอื่น ในขณะที่การดำเนินการอ่านจะถูกส่งไปยังโหนดเฉพาะเพื่อการอ่าน
2. โครงสร้างตามคอลัมน์
Cassandra ใช้โมเดลข้อมูลแบบคอลัมน์ ซึ่งคล้ายกับ BigTable ของ Google โมเดลนี้ช่วยให้ผู้ใช้จัดเก็บและสืบค้นข้อมูลได้ตามต้องการ โดยไม่ต้องกำหนดโครงสร้างข้อมูลทั้งหมดล่วงหน้า
3. มีความยืดหยุ่นสูง
Cassandra สามารถปรับขนาดได้สูงและสามารถเพิ่มโหนดได้อย่างง่ายดายเพื่อขยายความจุของคลัสเตอร์โดยไม่ต้องรีสตาร์ทกระบวนการใดๆ เปลี่ยนคำค้นหาของแอปพลิเคชัน หรือย้ายข้อมูลด้วยตนเอง
คุณสมบัติของ Cassandra เปรียบเทียบกับฐานข้อมูลอื่น
Cassandra เป็นฐานข้อมูลแบบไฮบริดที่ไม่สัมพันธ์กัน คล้ายกับ BigTable ของ Google มีฟังก์ชันที่สมบูรณ์กว่า Dynomite (ระบบจัดเก็บคีย์-ค่าแบบกระจาย) แต่การสนับสนุนไม่ดีเท่ากับ MongoDB ที่เก็บเอกสาร (ระหว่างฐานข้อมูลเชิงสัมพันธ์กับฐานข้อมูลที่ไม่ใช่เชิงสัมพันธ์) ฐานข้อมูลเชิงสัมพันธ์) ซึ่งเป็นผลิตภัณฑ์โอเพ่นซอร์สในบรรดาฐานข้อมูลเชิงสัมพันธ์ เป็นฐานข้อมูลที่มีคุณลักษณะหลากหลายที่สุดในบรรดาฐานข้อมูลที่ไม่เกี่ยวข้องและคล้ายกับฐานข้อมูลเชิงสัมพันธ์มากที่สุด โครงสร้างข้อมูลที่รองรับนั้นหลวมมากและเป็นรูปแบบ bjson ที่คล้ายกับ json สามารถจัดเก็บประเภทข้อมูลที่ซับซ้อนมากขึ้นได้)
Cassandra ได้รับการพัฒนาโดย Facebook และต่อมาได้กลายเป็นโครงการโอเพ่นซอร์ส เหมาะมากสำหรับความต้องการฐานข้อมูลในเครือข่ายโซเชียลคลาวด์คอมพิวติ้ง ขึ้นอยู่กับ Dynamo ที่เป็นเอกสิทธิ์เฉพาะของ Amazon และรวมโมเดลข้อมูลตามตระกูลคอลัมน์ของ Google BigTable พื้นที่จัดเก็บข้อมูลแบบกระจายอำนาจ P2P สามารถเรียกได้ว่าเป็น Dynamo 2.0 ในหลายๆ ด้าน
เมื่อเปรียบเทียบกับฐานข้อมูลอื่น Cassandra มีคุณสมบัติที่โดดเด่นดังต่อไปนี้:
1. ความยืดหยุ่นของสคีมา: ด้วย Cassandra เช่นเดียวกับที่เก็บเอกสาร คุณไม่จำเป็นต้องกำหนดฟิลด์ในบันทึกล่วงหน้า คุณสามารถเพิ่มหรือลบฟิลด์ได้ตามต้องการในขณะที่ระบบกำลังทำงาน นี่เป็นการเพิ่มประสิทธิภาพอย่างมากในการปรับใช้ขนาดใหญ่
2. ความสามารถในการปรับขนาดที่แท้จริง: Cassandra สามารถปรับขนาดในแนวนอนได้อย่างแท้จริง หากต้องการเพิ่มความจุให้กับคลัสเตอร์ เพียงชี้ไปที่เครื่องอื่น คุณไม่จำเป็นต้องรีสตาร์ทกระบวนการใดๆ เปลี่ยนการสืบค้นแอปพลิเคชัน หรือย้ายข้อมูลใดๆ ด้วยตนเอง
3. การระบุศูนย์ข้อมูลหลายศูนย์: คุณสามารถปรับเค้าโครงโหนดเพื่อหลีกเลี่ยงความล้มเหลวของศูนย์ข้อมูลแห่งเดียวได้ ศูนย์ข้อมูลสำรองจะมีสำเนาของทุกบันทึกเป็นอย่างน้อย เพื่อให้มั่นใจถึงความปลอดภัยของข้อมูล
ฟังก์ชั่นอื่นๆ
นอกเหนือจากคุณสมบัติหลักที่กล่าวถึงข้างต้นแล้ว Cassandra ยังมีคุณสมบัติอื่นๆ อีกด้วย:
1. การสืบค้นแบบช่วง: หากคุณไม่ต้องการดำเนินการสืบค้นค่าคีย์ทั้งหมด คุณสามารถกำหนดช่วงของคีย์ที่จะสืบค้นได้
2. โครงสร้างข้อมูลรายการ: ในโหมดผสม สามารถเพิ่มคอลัมน์ซุปเปอร์ลงในโครงสร้างข้อมูลห้ามิติได้ สะดวกมากสำหรับการจัดทำดัชนีต่อผู้ใช้
3. การดำเนินการเขียนแบบกระจาย: Cassandra ช่วยให้คุณสามารถอ่านหรือเขียนข้อมูลใดๆ จากส่วนกลางได้ทุกที่ทุกเวลา โดยไม่มีข้อผิดพลาดแม้แต่จุดเดียว
สรุป
Apache Cassandra 3 เป็นระบบจัดเก็บข้อมูลคีย์-ค่าแบบโอเพ่นซอร์สแบบกระจายที่ทรงพลัง ซึ่งมอบความสามารถในการปรับขนาดสูง ความยืดหยุ่นของสคีมา และความน่าเชื่อถือ ทำให้เหมาะสำหรับแอปพลิเคชันที่ต้องการจัดเก็บและประมวลผลข้อมูลจำนวนมาก