ustore下載 - ustore原始碼下載

ustore

其他源碼

v0.13.12

下載

優商店

模組化¹多模式²事務性³資料庫
對於人工智慧⁴和語義搜尋⁵

1. 支援：RocksDB • LevelDB • UDisk • UCSet 後端
2. 可以儲存： Blob • 文件 • 圖形 • 特徵 • 文字
3：保證原子性•一致性•隔離性•持久性
4：配備 Pandas 和 NetworkX API 以及 PyTorch 資料載入器
5：將向量搜尋與 USearch 和 UForm 集成

驅動程式：Python • C • C++ • GoLang • Java
軟體包：PyPI • CMake • Docker Hub

YouTube 簡介 • Discord 聊天 • 完整文檔

快速入門

安裝 UStore 非常簡單，使用起來就像 Python dict一樣簡單。

$ pip install ukv
$ python

from ukv import umem

db = umem . DataBase ()
db . main [ 42 ] = 'Hi'

我們剛剛建立了一個記憶體嵌入式事務資料庫，並在其main集合中新增了一個條目。您更喜歡磁碟上的資料嗎？換一行。

 from ukv import rocksdb

db = rocksdb . DataBase ( '/some-folder/' )

您想要連接到遠端 UStore 伺服器嗎？ UStore 隨附 Apache Arrow Flight RPC 介面！

 from ukv import flight_client

db = flight_client . DataBase ( 'grpc://0.0.0.0:38709' )

您是否儲存類似 NetworkX 的MultiDiGraph ？或類似 Pandas 的DataFrame ？

 db = rocksdb . DataBase ()

users_table = db [ 'users' ]. table
users_table . merge ( pd . DataFrame ([
    { 'id' : 1 , 'name' : 'Lex' , 'lastname' : 'Fridman' },
    { 'id' : 2 , 'name' : 'Joe' , 'lastname' : 'Rogan' },
]))

friends_graph = db [ 'friends' ]. graph
friends_graph . add_edge ( 1 , 2 )

assert friends_graph . has_edge ( 1 , 2 ) and 
    friends_graph . has_node ( 1 ) and 
    friends_graph . number_of_edges ( 1 , 2 ) == 1

函數呼叫可能看起來相同，但底層實作可以尋址遠端電腦上持久記憶體中某處的數百 TB 資料。

是否有其他人同時更新這些集合？捆綁您的操作以確保一致性！

 db = rocksdb . DataBase ()
with db . transact () as txn :
    txn [ 'users' ]. table . merge (...)
    txn [ 'friends' ]. graph . add_edge ( 1 , 2 )

到目前為止，我們只介紹了 UStore 的一小部分。您可以用它來...

取得 RocksDB 或 LevelDB 的 C99、Python、GoLang 或 Java 包裝器。
透過 Apache Arrow Flight RPC 為 Spark、Kafka 或 PyTorch 提供服務。
將文件和圖形儲存在嵌入式資料庫中，避免網路開銷。
在一個 API 下，在記憶體後端和持久後端之間分層 DBMS。

但UStore 還可以。這是地圖：

基本用法：
- 方式
  - 儲存 Blob
  - 儲存檔案
  - 儲存圖表
  - 儲存向量
- 司機
  - 對於Python Δ
  - 對於 C Δ
  - 對於 C++ Δ
  - 對於 Go 語言 Δ
  - 對於 Java Δ
- 人工智慧用例 Δ
- 常見問題解答
- 常見問題解答
生產、效能調整和管理的高階用法：
- 引擎
- 交易
  - 原子性
  - 一致性
  - 隔離
  - 耐用性
- 容器和雲端部署
- 配置
  - 鑰匙尺寸
  - 值大小
- 工具 Δ
- 測試 Δ
- 基準 Δ
對於希望分叉、擴展、包裝或分發並可能透過 UStore 替代版本獲利的貢獻者和高級用戶：
- 架構和依賴關係 Δ
- 路線圖 Δ
- 貢獻 Δ

## 基本用法

UStore 的目的不僅是作為資料庫，而是作為「建構資料庫」工具包和 NoSQL 潛在事務資料庫的開放標準，為「建立、讀取、更新、刪除」操作（簡稱 CRUD）定義零拷貝二進位介面。

一些簡單的 C99 標頭可以將幾乎任何底層儲存引擎連結到眾多高級語言驅動程序，將對二進位字串值的支援擴展到圖形、靈活模式文件和其他模式，旨在取代 MongoDB、Neo4J、Pinecone 和 ElasticSearch使用單一ACID 事務系統。

UStore：小地圖

例如，Redis 提供了具有類似目標的 RediSearch、RedisJSON 和 RedisGraph。 UStore 做得更好，讓您可以添加您最喜歡的鍵值儲存 (KVS)，嵌入式、獨立或分片，例如 FoundationDB，從而增強其功能。

方式

斑點

二進位大物件可以放置在 UStore 中。根據所使用的底層技術，性能會有很大差異。記憶體中的 UCSet 速度最快，但最不適合較大的物件。持久化 UDisk 在正確配置後，可以完全繞過 Linux 內核，包括檔案系統層，直接尋址塊設備。

UDisk 和 RocksDB 的二進位處理效能圖表

當基於 SPDK 等用戶空間驅動程式建置時，高階伺服器上的現代持久 IO 每個套接字可以超過 100 GB/s。這接近高階 RAM 的實際吞吐量，並解鎖了資料庫用例中不常見的新功能。現在，人們可以將千兆位元組大小的視訊檔案放在 ACID 事務資料庫中，緊鄰其元數據，而不是使用像 MinIO 這樣的單獨的物件儲存。

文件

JSON 是當今最常用的文檔格式。 UStore 文件集合支援 JSON，以及 MongoDB 使用的 MessagePack 和 BSON。

UStore 和 MongoDB 的文件處理效能圖表

UStore 還不能水平擴展，但可以提供更高的單節點效能，並且借助開源的simdjson和yyjson庫，在多核心系統上具有幾乎線性的垂直可擴展性。此外，要與資料交互，您不需要像 MQL 這樣的自訂查詢語言。相反，我們優先考慮開放 RFC 標準，以真正避免供應商鎖定：

JSON 指標：RFC 6901 用於定址巢狀欄位。
JSON 補丁：用於字段級更新的 RFC 6902。
JSON MergePatch：用於文件級更新的 RFC 7386。

圖表

現代圖形資料庫（例如 Neo4J）難以應對巨大的工作負載。它們需要太多的 RAM，而且它們的演算法一次只能觀察一個條目的資料。我們在兩個方面進行優化：

使用增量編碼來壓縮倒排索引。
更新高延遲儲存的經典圖形演算法，以類似批次或以邊緣為中心的方式處理圖形。

向量

特徵儲存和向量資料庫（例如 Pinecone、Milvus 和 USearch）為向量搜尋提供獨立索引。 UStore 將其實現為單獨的模式，與文件和圖表相同。特徵：

8 位元整數化。
16 位浮點量化。
餘弦、內積和歐幾裡得度量。

司機

用於 Python 的 UStore 和用於 C++ 的 UStore 看起來非常不同。我們的 Python SDK 模仿其他 Python 函式庫 - Pandas 和 NetworkX。同樣，C++ 函式庫提供了 C++ 開發人員所期望的介面。

UStore：前端

眾所周知，人們會出於不同的目的使用不同的語言。某些語言未實現某些 C 級功能。要嘛是因為沒有需求，要嘛是因為我們還沒做到這一點。

姓名	辦理	收藏	批次	文件	圖表	副本
C99標準	✓	✓	✓	✓	✓	0

C++ SDK	✓	✓	✓	✓	✓	0
Python SDK	✓	✓	✓	✓	✓	0-1
Go語言SDK	✓	✓	✓	✗	✗	1
Java SDK	✓	✓	✗	✗	✗	1

箭飛行 API	✓	✓	✓	✓	✓	0-2

這裡的一些前端周圍有整個生態系統！例如，Apache Arrow Flight API 擁有自己的 C、C++、C#、Go、Java、JavaScript、Julia、MATLAB、Python、R、Ruby 和 Rust 驅動程式。

UStore：前端

常見問題解答

預設情況下，密鑰是 64 位元整數。為什麼？
值是長度小於 4 GB 的二進位字串。為什麼？

常見問題解答

交易預設為 ACI(D)。這是什麼意思？
為什麼不使用 LevelDB 或 RocksDB 介面？已回答
為什麼不使用 SQL、MQL 或 CYPHER？已回答
UStore 支援生存時間嗎？已回答
UStore支援壓縮嗎？已回答
UStore支援隊列嗎？已回答
如何新增 X 語言的驅動程式？已回答
如何新增資料庫 X 作為引擎？已回答

進階用法

引擎

以下引擎幾乎可以互換使用。從歷史上看，LevelDB 是第一個。 RocksDB 隨後改進了功能和效能。現在它成為一半 DBMS 新創公司的基礎。

	水平資料庫	Rocks資料庫	磁碟	UC集
速度	1x	2x	10倍	30倍
執著的	✓	✓	✓	✗
交易性	✗	✓	✓	✓
區塊設備支援	✗	✗	✓	✗
加密	✗	✗	✓	✗
手錶	✗	✓	✓	✓
快照	✓	✓	✓	✗
隨機抽樣	✗	✗	✓	✓
批次枚舉	✗	✗	✓	✓
命名集合	✗	✓	✓	✓
開源	✓	✓	✗	✓
相容性	任何	任何	Linux	任何
維護者	Google	Facebook	烏努姆	烏努姆

UCSet 和 UDisk 均由 Unum 設計和維護。兩者的功能都很齊全，但我們的替代方案提供的最關鍵的功能是效能。記憶力快很容易。 UCSet 的核心邏輯可以在模板化的僅標頭ucset庫中找到。

設計 UDisk 是一項更具挑戰性的工作，歷時 7 年。它包括發明新的樹狀結構、使用io_uring實現部分核心旁路、使用SPDK實現完全旁路、CUDA GPU 加速，甚至自訂內部檔案系統。 UDisk 是第一個從頭開始設計並考慮並行架構和核心旁路的引擎。

交易

原子性

原子性始終得到保證。即使在非事務性寫入上 - 要么所有更新都通過，要么全部失敗。

一致性

一致性以盡可能嚴格的形式實現 - “嚴格可串行化”意味著：

讀取是“可序列化的”，
寫入是“線性化的”。

但是，可以在特定操作層級調整預設行為。為此， ::ustore_option_transaction_dont_watch_k可以傳遞給ustore_transaction_init()或任何事務性讀取/寫入操作，以控制暫存期間的一致性檢查。

	讀	寫
頭	嚴格系列	嚴格系列
透過快照進行交易	序列	嚴格系列
沒有快照的交易	嚴格系列	嚴格系列
不含手錶的交易	嚴格系列	順序

如果您對這個主題不熟悉，請查看有關一致性的 Jepsen.io 部落格。

隔離

	讀	寫
透過快照進行交易	✓	✓
沒有快照的交易	✗	✓

耐用性

根據定義，持久性不適用於記憶體系統。在混合或持久系統中，我們更喜歡預設禁用它。幾乎每個建置在 KVS 之上的 DBMS 都喜歡實作自己的持久性機制。在分散式資料庫中更是如此，其中可能存在三個單獨的預寫日誌：

在KVS中，
在資料庫管理系統中，
在分散式共識的實施中。

如果您仍然需要持久性，請使用可選標誌刷新寫入提交。在 C 驅動程式中，您可以使用::ustore_option_write_flush_k標誌來呼叫ustore_transaction_commit() 。

容器和雲端部署

整個 DBMS 適合小於 100 MB 的 Docker 映像。執行以下腳本來拉取並運行容器，在連接埠38709上公開 Apache Arrow Flight 伺服器。預設情況下，客戶端 SDK 也將透過相同連接埠進行通訊。

docker run -d --rm --name ustore-test -p 38709:38709 unum/ustore

可以透過以下方式檢索預設設定檔：

cat /var/lib/ustore/config.json

連接和測試的最簡單方法是使用以下命令：

python ...

預先包裝的 UStore 鏡像可在多個平台上使用：

Docker Hub 映像：v0.7。
RedHat OpenShift 操作員：v0.7。
亞馬遜 AWS Marketplace 圖片：
- 免費社群版：v0.4。
- 內存版：
- 性能版：

不要猶豫，將 UStore 商業化並重新分發。

配置

調整資料庫既是一門藝術，也是一門科學。像 RocksDB 這樣的專案提供了數十個旋鈕來優化行為。我們允許將專門的設定檔轉送到底層引擎。

{
    "version" : " 1.0 " ,
    "directory" : " ./tmp/ "
}

我們還有一個更簡單的程序，對於 80% 的用戶來說已經足夠了。可以擴展以利用多個設備或目錄，或轉發專門的引擎配置。

{
    "version" : " 1.0 " ,
    "directory" : " /var/lib/ustore " ,
    "data_directories" : [
        {
            "path" : " /dev/nvme0p0/ " ,
            "max_size" : " 100GB "
        },
        {
            "path" : " /dev/nvme1p0/ " ,
            "max_size" : " 100GB "
        }
    ],
    "engine" : {
        "config_file_path" : " ./engine_rocksdb.ini " ,
    }
}