Milvus ist eine Open-Source-Vektordatenbank, die die Einbettung von Ähnlichkeitssuche und KI-Anwendungen ermöglicht. Milvus macht die Suche nach unstrukturierten Daten leichter zugänglich und bietet unabhängig von der Bereitstellungsumgebung eine konsistente Benutzererfahrung.
Milvus 2.0 ist eine Cloud-native Vektordatenbank mit konstruktionsbedingt getrennter Speicherung und Berechnung. Alle Komponenten in dieser überarbeiteten Version von Milvus sind zustandslos, um die Elastizität und Flexibilität zu verbessern. Weitere Architekturdetails finden Sie unter Übersicht über die Milvus-Architektur.
Milvus wurde im Oktober 2019 unter der Open-Source-Apache-Lizenz 2.0 veröffentlicht. Es ist derzeit ein Abschlussprojekt der LF AI & Data Foundation.
Umfangreiche APIs für Data-Science-Workflows.
Konsistente Benutzererfahrung auf Laptop, lokalem Cluster und Cloud.
Integrieren Sie Echtzeitsuche und -analysen in praktisch jede Anwendung.
Diese Funktion ist besonders nützlich in umfassenden Suchszenarien, wie z. B. der Identifizierung der ähnlichsten Person in einer Vektorbibliothek anhand verschiedener Attribute wie Bilder, Stimme, Fingerabdrücke usw. Weitere Informationen finden Sie unter Hybridsuche.
Zilliz Cloud ist ein vollständig verwalteter Dienst in der Cloud und die einfachste Möglichkeit, LF AI Milvus® bereitzustellen. Sehen Sie sich Zilliz Cloud an und starten Sie Ihre kostenlose Testversion.
Eigenständige Kurzanleitung
Cluster-Kurzanleitung
Erweiterte Bereitstellung
Prüfen Sie zunächst die Anforderungen.
Linux-Systeme (Ubuntu 20.04 oder höher empfohlen):
gehen: >= 1,21 cmake: >= 3.26.4 gcc: 9,5 Python: > 3.8 und <= 3.11
MacOS-Systeme mit x86_64 (Big Sur 11.5 oder höher empfohlen):
gehen: >= 1,21 cmake: >= 3.26.4 llvm: >= 15 Python: > 3.8 und <= 3.11
MacOS-Systeme mit Apple Silicon (Monterey 12.0.1 oder höher empfohlen):
go: >= 1,21 (Arch=ARM64) cmake: >= 3.26.4 llvm: >= 15 Python: > 3.8 und <= 3.11
Klonen Sie das Milvus-Repo und erstellen Sie es.
# Github-Repository klonen.$ git clone https://github.com/milvus-io/milvus.git# Abhängigkeiten von Drittanbietern installieren.$ cd milvus/ $ ./scripts/install_deps.sh# Milvus kompilieren.$ make
Die vollständige Geschichte finden Sie in der Dokumentation des Entwicklers.
WICHTIG Der Master-Zweig dient der Entwicklung von Milvus v2.0. Am 9. März 2021 haben wir Milvus v1.0 veröffentlicht, die erste stabile Version von Milvus mit langfristiger Unterstützung. Um Milvus v1.0 zu verwenden, wechseln Sie zu Zweig 1.0.
Weitere Informationen finden Sie unter Milvus 2.0 vs. 1.x.
Bildsuche | Chatbots | Suche nach chemischen Strukturen |
---|
Bilder durchsuchbar gemacht. Geben Sie sofort die ähnlichsten Bilder aus einer umfangreichen Datenbank zurück.
Interaktiver digitaler Kundenservice, der Benutzern Zeit und Unternehmen Geld spart.
Blitzschnelle Ähnlichkeitssuche, Unterstruktursuche oder Überstruktursuche für ein bestimmtes Molekül.
Das Milvus-Bootcamp soll Benutzern sowohl die Einfachheit als auch die Tiefe der Vektordatenbank näher bringen. Erfahren Sie, wie Sie Benchmark-Tests durchführen und Ähnlichkeitssuchanwendungen erstellen, die Chatbots, Empfehlungssysteme, umgekehrte Bildsuche, molekulare Suche und vieles mehr umfassen.
Beiträge zu Milvus sind von jedem willkommen. Weitere Informationen zum Einreichen von Patches und zum Beitragsworkflow finden Sie in den Richtlinien für Beiträge. Sehen Sie sich unser Community-Repository an, um mehr über unsere Governance zu erfahren und auf weitere Community-Ressourcen zuzugreifen.
Anleitungen zur Installation, Entwicklung, Bereitstellung und Verwaltung finden Sie in den Milvus-Dokumenten. Technische Meilensteine und Verbesserungsvorschläge finden Sie unter milvus confluence
Das implementierte SDK und seine API-Dokumentation sind unten aufgeführt:
PyMilvus SDK
Java SDK
Gehen Sie zum SDK
Cpp SDK (in Entwicklung)
Knoten-SDK
Rust SDK (in Entwicklung)
CSharp SDK (in Entwicklung)
Attu bietet eine intuitive und effiziente Benutzeroberfläche für Milvus.
Schnellstart
Treten Sie der Milvus-Community auf Discord bei, um Ihre Vorschläge, Ratschläge und Fragen mit unserem Technikteam zu teilen.
Sie können auch unsere FAQ-Seite besuchen, um Lösungen oder Antworten auf Ihre Probleme oder Fragen zu finden.
Abonnieren Sie Milvus-Mailinglisten:
Technischer Lenkungsausschuss
Technische Diskussionen
Bekanntmachung
Folgen Sie Milvus in den sozialen Medien:
Medium
X
Youtube
Referenz zum Zitieren, wenn Sie Milvus in einer Forschungsarbeit verwenden:
@inproceedings{2021milvus, title={Milvus: A Purpose-Built Vector Data Management System}, author={Wang, Jianguo and Yi, Xiaomeng and Guo, Rentong and Jin, Hai and Xu, Peng and Li, Shengjun and Wang, Xiangyu and Guo, Xiangzhou and Li, Chengming and Xu, Xiaohai and others}, booktitle={Proceedings of the 2021 International Conference on Management of Data}, pages={2614--2627}, year={2021} } @article{2022manu, title={Manu: a cloud native vector database management system}, author={Guo, Rentong and Luan, Xiaofan and Xiang, Long and Yan, Xiao and Yi, Xiaomeng and Luo, Jigao and Cheng, Qianya and Xu, Weizhi and Luo, Jiarui and Liu, Frank and others}, journal={Proceedings of the VLDB Endowment}, volume={15}, number={12}, pages={3548--3561}, year={2022}, publisher={VLDB Endowment} }
Milvus übernimmt Abhängigkeiten von Folgendem:
Vielen Dank an FAISS für die hervorragende Suchbibliothek.
Vielen Dank an etcd für die Bereitstellung großartiger Open-Source-Tools zum Speichern von Schlüsselwerten.
Vielen Dank an Pulsar für sein wunderbares verteiltes Pub-Sub-Messaging-System.
Vielen Dank an Tantivy für seine in Rust geschriebene Volltextsuchmaschinenbibliothek.
Vielen Dank an RocksDB für die leistungsstarken Speicher-Engines.
Milvus wird von folgendem OpenSource-Projekt übernommen:
Towhee ist ein flexibles, anwendungsorientiertes Framework zur Berechnung von Einbettungsvektoren über unstrukturierte Daten.
Haystack ist ein Open-Source-NLP-Framework, das Transformer-Modelle nutzt
Langchain Erstellen von Anwendungen mit LLMs durch Zusammensetzbarkeit
LLamaIndex ist ein Datenframework für Ihre LLM-Anwendungen
GPTCache ist eine Bibliothek zum Erstellen eines semantischen Caches zum Speichern von Antworten aus LLM-Abfragen.