(VectorAI está depreciado e não é mais mantido. Recomendamos o uso de Relevance AI para usar pesquisa vetorial, confira https://tryrelevance.com)
Vector AI é uma estrutura projetada para tornar o processo de construção de aplicativos baseados em vetores de nível de produção o mais rápido e fácil possível. Crie, armazene, manipule, pesquise e analise vetores junto com documentos JSON para potencializar aplicativos como pesquisa neural, pesquisa semântica, recomendações personalizadas, etc.
- Visite nosso site e cadastre-se para obter uma chave de API: https://getvectorai.com
- Para documentação Python: https://vector-ai.github.io/vectorai
- Para documentação da API REST: https://api.vctr.ai/documentation
- Participe do nosso discord: https://discord.gg/CbwUxyD
- Para uma introdução mais suave comparando nossos recursos, leia https://getvectorai.com/production-ready-search-in-5- Minutes/
Características
- Vetorização de dados multimídia : Image2Vec, Audio2Vec, etc (qualquer dado pode ser transformado em vetores por meio de aprendizado de máquina)
- Armazenamento Orientado a Documentos : Armazene seus vetores junto com documentos sem ter que fazer uma pesquisa no banco de dados para metadados sobre os vetores.
- Pesquisa por similaridade vetorial : permite a pesquisa de vetores e multimídia avançada com pesquisa por similaridade vetorial. A espinha dorsal de muitos casos de uso populares de IA, como pesquisa reversa de imagens, recomendações, personalização, etc.
- Pesquisa Híbrida : Existem cenários onde a pesquisa vetorial não é tão eficaz quanto a pesquisa tradicional, por exemplo, pesquisa por skus. Vector AI permite combinar a pesquisa vetorial com todos os recursos da pesquisa tradicional, como filtragem, pesquisa difusa e correspondência de palavras-chave para criar uma pesquisa ainda mais poderosa.
- Pesquisa ponderada de vários modelos : nossa pesquisa de vetores é altamente personalizável e você pode realizar pesquisas com vários vetores de vários modelos e atribuir-lhes pesos diferentes.
- Operações vetoriais : pesquisa flexível com operações prontas para uso em vetores. por exemplo, média, mediana, soma, etc.
- Agregação : toda a agregação tradicional que você esperaria. por exemplo, agrupar por média, tabelas dinâmicas, etc.
- Clustering : interprete seus vetores e dados alocando-os em buckets e obtenha estatísticas sobre esses diferentes buckets com base nos dados que você fornece.
- Análise vetorial : obtenha uma melhor compreensão de seus vetores usando análises vetoriais práticas e prontas para uso, proporcionando melhor compreensão da qualidade de seus vetores.
Terminologias rápidas
- Modelos/Codificadores (também conhecidos como Incorporadores) ~ Transforma dados em vetores, por exemplo, Word2Vec transforma palavras em vetores
- Pesquisa de similaridade vetorial (também conhecida como pesquisa de vizinho mais próximo, pesquisa de distância)
- Coleção (também conhecida como Índice, Tabela) ~ uma coleção é composta de vários documentos
- Documentos (também conhecidos como Json, Item, Dicionário, Linha) ~ um documento pode conter vetores, texto e links para vídeos/imagens/áudio.
Início rápido
Instale via pip! Compatível com qualquer sistema operacional.
Se você precisar da versão noturna devido a melhorias contínuas, poderá instalar a versão noturna usando:
pip install vectorai-nightly
Observação: embora a versão noturna ainda passe nos testes automatizados, ela pode não ser estável.
Confira nosso caderno de início rápido sobre como criar um mecanismo de pesquisa de texto/imagem/áudio em 5 minutos: quickstart.ipynb
from vectorai import ViClient, request_api_key
api_key = request_api_key(username=<username>, email=<email>, description=<description>, referral_code="github_referred")
vi_client = ViClient(username=username, api_key=api_key)
from vectorai.models.deployed import ViText2Vec
text_encoder = ViText2Vec(username, api_key)
documents = [
{
'_id': 0,
'color': 'red'
},
{
'_id': 1,
'color': 'blue'
}
]
# Insert the data
vi_client.insert_documents('test-collection', documents, models={'color': text_encoder.encode})
# Search the data
vi_client.search('test-collection', text_encoder.encode('maroon'), 'color_vector_', page_size=2)
# Get Recommendations
vi_client.search_by_id('test-collection', '1', 'color_vector_', page_size=2)
Acesse análises vetoriais poderosas
Vector AI possui visualizações poderosas para permitir que você analise seus vetores da maneira mais fácil possível - em uma linha de código.
vi_client.plot_dimensionality_reduced_vectors(documents,
point_label='title',
dim_reduction_field='_dr_ivis',
cluster_field='centroid_title', cluster_label='centroid_title')
vi_client.plot_2d_cosine_similarity(
documents,
documents[0:2],
vector_fields=['use_vector_'],
label='name',
anchor_document=documents[0]
)
Compare facilmente vetores e seu desempenho de pesquisa em seus documentos!
Por que Vector AI em comparação com outras implementações do vizinho mais próximo?
- Pronto para produção : nossa API é totalmente gerenciada e pode ser dimensionada para alimentar centenas de milhões de pesquisas por dia. Mesmo em milhões de pesquisas, o cache de borda, a utilização de GPU e a otimização de software são extremamente rápidos, para que você nunca precise se preocupar em dimensionar sua infraestrutura à medida que seu caso de uso aumenta.
- Simples de usar. Rápido para começar. : Um dos nossos princípios básicos de design é que nos concentramos em como as pessoas podem começar a usar o Vector AI o mais rápido possível, garantindo ao mesmo tempo que ainda haja uma tonelada de funcionalidades e opções de personalização.
- Compreensão mais rica de seus vetores e suas propriedades : Nossa biblioteca foi projetada para permitir que as pessoas façam mais do que apenas obter vizinhos mais próximos, mas realmente experimentem, analisem, interpretem e melhorem-nos no momento em que os dados são adicionados ao índice.
- Armazene dados vetoriais com facilidade : A natureza orientada a documentos do Vector AI permite aos usuários rotular, filtrar a pesquisa e compreender seus vetores tanto quanto possível.
- Acesso aos dados em tempo real : os dados do Vector AI são acessíveis em tempo real, assim que os dados são inseridos, eles podem ser pesquisados imediatamente. Não há necessidade de esperar horas para construir um índice.
- Agnóstico de estrutura : Nunca forçaremos uma estrutura específica no Vector AI. Se você tiver uma estrutura de escolha, poderá usá-la - desde que seus documentos sejam serializáveis em JSON!
Usando modelos VectorHub
VectorHub é o principal repositório de modelos da Vector AI. Os modelos do VectorHub são construídos com interfaces scikit-learn e todos possuem exemplos de integração do Vector AI. Se você deseja experimentar novos modelos prontos para uso, recomendamos experimentar os modelos VectorHub - todos eles foram testados no Colab e podem ser usados em apenas 3 linhas de código!
Regras de esquema para documentos (vetores e IDs BYO)
Certifique-se de que todos os campos de vetor contenham um '_vector_' em seu nome e que todos os campos de ID tenham o nome '_id'.
Por exemplo:
example_item = {
'_id': 'James',
'skills_vector_': [0.123, 0.456, 0.789, 0.987, 0.654, 0.321]
}
O seguinte não será reconhecido como colunas de ID ou colunas de vetor.
example_item = {
'name_id': 'James',
'skillsvector_': [0.123, 0.456, 0.789, 0.987, 0.654, 0.321]
}
Como isso difere da API VectorAI?
O Python SDK foi projetado para fornecer uma maneira para os Pythonistas desbloquearem o poder do VectorAI com o mínimo de linhas de código possível. Ele expõe todos os elementos de uma API por meio de nossa ferramenta de automação de código aberto e é a principal forma de nossos cientistas e engenheiros de dados interagirem com o mecanismo VectorAI para prototipagem rápida antes que os desenvolvedores utilizem solicitações de API.
Nota : O VectorAI SDK é construído no servidor de desenvolvimento, o que às vezes pode causar erros. No entanto, isso é importante para garantir que os usuários possam acessar os recursos mais avançados conforme necessário. Se você se deparar com esses problemas, recomendamos criar um problema no GitHub se não for urgente, mas sinta-se à vontade para fazer ping no canal Discord para perguntas mais urgentes.
Construindo produtos com Vector AI
Criando um assistente de moda com IA multilíngue: https://fashionfiesta.me | Blogue
Compartilhe conosco quaisquer blogs ou sites que você criar com Vector AI!