Chroma - ฐานข้อมูลการฝังโอเพ่นซอร์ส
วิธีที่เร็วที่สุดในการสร้างแอป Python หรือ JavaScript LLM พร้อมหน่วยความจำ!
- - เอกสาร | หน้าแรก
pip install chromadb # python client
# for javascript, npm install chromadb!
# for client-server mode, chroma run --path /chroma_db_path
API หลักมีเพียง 4 ฟังก์ชันเท่านั้น (เรียกใช้ Google Colab หรือเทมเพลต Replit ของเรา):
import chromadb
# setup Chroma in-memory, for easy prototyping. Can add persistence easily!
client = chromadb . Client ()
# Create collection. get_collection, get_or_create_collection, delete_collection also available!
collection = client . create_collection ( "all-my-documents" )
# Add docs to the collection. Can also update and delete. Row-based API coming soon!
collection . add (
documents = [ "This is document1" , "This is document2" ], # we handle tokenization, embedding, and indexing automatically. You can skip that and add your own embeddings as well
metadatas = [{ "source" : "notion" }, { "source" : "google-docs" }], # filter on these!
ids = [ "doc1" , "doc2" ], # unique for each doc
)
# Query/search 2 most similar results. You can also .get by id
results = collection . query (
query_texts = [ "This is a query document" ],
n_results = 2 ,
# where={"metadata_field": "is_equal_to_this"}, # optional filter
# where_document={"$contains":"search_string"} # optional filter
)
?️? LangChain
(หลามและ js) ? LlamaIndex
และอื่นๆ เร็วๆ นี้ ตัวอย่างเช่น กรณีการใช้งาน "Chat your data"
:
GPT3
เพื่อการสรุปหรือการวิเคราะห์เพิ่มเติม การฝังคืออะไร?
[1.2, 2.1, ....]
. กระบวนการนี้ทำให้เอกสาร "เข้าใจได้" สำหรับโมเดลการเรียนรู้ของเครื่องฐานข้อมูลการฝัง (หรือที่เรียกว่า ฐานข้อมูลเวกเตอร์ ) จัดเก็บการฝังและอนุญาตให้คุณค้นหาโดยเพื่อนบ้านที่ใกล้ที่สุด แทนที่จะใช้สตริงย่อยเหมือนฐานข้อมูลแบบดั้งเดิม ตามค่าเริ่มต้น Chroma จะใช้ Sentence Transformers เพื่อฝังให้คุณ แต่คุณยังสามารถใช้การฝัง OpenAI, การฝัง Cohere (หลายภาษา) หรือของคุณเองก็ได้
Chroma เป็นโครงการที่กำลังพัฒนาอย่างรวดเร็ว เรายินดีต้อนรับผู้มีส่วนร่วมในการประชาสัมพันธ์และแนวคิดในการปรับปรุงโครงการ
#contributing
Good first issue tag
Release Cadence ขณะนี้เราเปิดตัวแพ็คเกจ pypi
และ npm
เวอร์ชันแท็กใหม่ในวันจันทร์ โปรแกรมแก้ไขด่วนจะดับลงเมื่อใดก็ได้ในระหว่างสัปดาห์
อาปาเช่ 2.0