Milvus — это векторная база данных с открытым исходным кодом, созданная для внедрения приложений поиска по сходству и искусственного интеллекта. Milvus делает поиск неструктурированных данных более доступным и обеспечивает единообразный пользовательский интерфейс независимо от среды развертывания.
Milvus 2.0 — это облачная векторная база данных, хранилище и вычисления которой разделены в зависимости от конструкции. Все компоненты в этой обновленной версии Milvus не имеют состояния для повышения эластичности и гибкости. Дополнительные сведения об архитектуре см. в разделе «Обзор архитектуры Milvus».
Milvus был выпущен под лицензией Apache 2.0 с открытым исходным кодом в октябре 2019 года. В настоящее время это дипломный проект LF AI & Data Foundation.
Богатые API, предназначенные для рабочих процессов обработки данных.
Согласованный пользовательский опыт на ноутбуке, локальном кластере и облаке.
Встраивайте поиск и аналитику в реальном времени практически в любое приложение.
Эта функция особенно полезна в сценариях комплексного поиска, таких как идентификация наиболее похожего человека в векторной библиотеке на основе различных атрибутов, таких как изображения, голос, отпечатки пальцев и т. д. Подробности см. в разделе Гибридный поиск.
Zilliz Cloud — это полностью управляемый сервис в облаке и самый простой способ развернуть LF AI Milvus®. Посмотрите Zilliz Cloud и начните бесплатную пробную версию.
Автономное краткое руководство по началу работы
Краткое руководство по кластеру
Расширенное развертывание
Сначала проверьте требования.
Системы Linux (рекомендуется Ubuntu 20.04 или новее):
идти: >= 1,21 cmake: >= 3.26.4 ГЦК: 9,5 питон: > 3.8 и <= 3.11
Системы MacOS с x86_64 (рекомендуется Big Sur 11.5 или новее):
идти: >= 1,21 cmake: >= 3.26.4 лвм: >= 15 питон: > 3.8 и <= 3.11
Системы MacOS с Apple Silicon (рекомендуется Monterey 12.0.1 или новее):
идти: >= 1,21 (Arch=ARM64) cmake: >= 3.26.4 лвм: >= 15 питон: > 3.8 и <= 3.11
Клонируйте репозиторий Milvus и создайте его.
# Клонировать репозиторий github.$ git clone https://github.com/milvus-io/milvus.git# Установить сторонние зависимости.$ cd milvus/ $ ./scripts/install_deps.sh# Скомпилируйте Milvus.$ make
Полную информацию см. в документации разработчика.
ВАЖНО. Основная ветка предназначена для разработки Milvus v2.0. 9 марта 2021 г. мы выпустили Milvus v1.0, первую стабильную версию Milvus с долгосрочной поддержкой. Чтобы использовать Milvus v1.0, переключитесь на ветку 1.0.
См. Milvus 2.0 и 1.x для получения дополнительной информации.
Поиск изображений | Чат-боты | Поиск химической структуры |
---|
Изображения стали доступными для поиска. Мгновенно возвращайте наиболее похожие изображения из огромной базы данных.
Интерактивное цифровое обслуживание клиентов, которое экономит время пользователей и деньги бизнеса.
Невероятно быстрый поиск по сходству, поиск субструктур или поиск суперструктур для указанной молекулы.
Учебный курс Milvus предназначен для того, чтобы познакомить пользователей с простотой и глубиной векторной базы данных. Узнайте, как проводить тесты производительности, а также создавать приложения для поиска сходства, включающие чат-ботов, системы рекомендаций, обратный поиск по изображениям, молекулярный поиск и многое другое.
Пожертвования в Милвус приветствуются от всех. Подробную информацию об отправке исправлений и рабочем процессе внесения вклада см. в разделе «Рекомендации по участию». Посетите наш репозиторий сообщества, чтобы узнать о нашем управлении и получить доступ к дополнительным ресурсам сообщества.
Рекомендации по установке, разработке, развертыванию и администрированию можно найти в документации Milvus. Чтобы узнать о технических достижениях и предложениях по усовершенствованию, посетите сайт Milvus Confluence.
Реализованный SDK и документация по его API перечислены ниже:
PyMilvus SDK
Java SDK
Перейти к SDK
Cpp SDK (в разработке)
Нодовый SDK
Rust SDK (в разработке)
CSharp SDK (в разработке)
Attu предоставляет интуитивно понятный и эффективный графический интерфейс для Milvus.
Быстрый старт
Присоединяйтесь к сообществу Milvus в Discord, чтобы делиться своими предложениями, советами и вопросами с нашей командой разработчиков.
Вы также можете посетить нашу страницу часто задаваемых вопросов, чтобы найти решения или ответы на ваши проблемы или вопросы.
Подпишитесь на рассылку Milvus:
Технический руководящий комитет
Технические обсуждения
Объявление
Следите за Милвусом в социальных сетях:
Середина
Х
Ютуб
Ссылка на ссылку при использовании Milvus в исследовательской работе:
@inproceedings{2021milvus, title={Milvus: A Purpose-Built Vector Data Management System}, author={Wang, Jianguo and Yi, Xiaomeng and Guo, Rentong and Jin, Hai and Xu, Peng and Li, Shengjun and Wang, Xiangyu and Guo, Xiangzhou and Li, Chengming and Xu, Xiaohai and others}, booktitle={Proceedings of the 2021 International Conference on Management of Data}, pages={2614--2627}, year={2021} } @article{2022manu, title={Manu: a cloud native vector database management system}, author={Guo, Rentong and Luan, Xiaofan and Xiang, Long and Yan, Xiao and Yi, Xiaomeng and Luo, Jigao and Cheng, Qianya and Xu, Weizhi and Luo, Jiarui and Liu, Frank and others}, journal={Proceedings of the VLDB Endowment}, volume={15}, number={12}, pages={3548--3561}, year={2022}, publisher={VLDB Endowment} }
Milvus принимает зависимости от следующего:
Спасибо FAISS за прекрасную библиотеку поиска.
Спасибо etcd за предоставление отличных инструментов для хранения ключей и значений с открытым исходным кодом.
Спасибо Pulsar за его замечательную распределенную систему обмена сообщениями между пабами и подписками.
Спасибо Tantivy за библиотеку полнотекстовых поисковых систем, написанную на Rust.
Спасибо RocksDB за мощные механизмы хранения.
Milvus используется в следующем проекте с открытым исходным кодом:
Towhee — гибкая прикладно-ориентированная среда для вычисления векторов внедрения в неструктурированные данные.
Haystack — платформа НЛП с открытым исходным кодом, использующая модели Transformer.
Langchain Создание приложений с помощью LLM за счет возможности компоновки
LLamaIndex — платформа данных для ваших приложений LLM
GPTCache — библиотека для создания семантического кэша для хранения ответов на запросы LLM.