O banco de dados de pesquisa de IA.
Início rápido | Documentos Núclia | Comunidade
NucliaDB é um banco de dados robusto que permite armazenar e pesquisar dados não estruturados.
É um banco de dados de pesquisa híbrido pronto para uso, utilizando índices vetoriais, de texto completo e gráficos.
NucliaDB é escrito em Rust e Python. Nós o projetamos para indexar grandes conjuntos de dados e fornecer suporte multilocatário.
Ao utilizar o NucliaDB com a nuvem Nuclia, você pode aproveitar o poder de um banco de dados de PNL sem o incômodo de extração, enriquecimento e inferência de dados. Nós fazemos todo o trabalho duro para você.
Características
- Armazene texto, arquivos, vetores, rótulos e anotações
- Realize pesquisas de texto e, dada uma palavra ou conjunto de palavras, retorne recursos em nosso banco de dados que as contenham.
- Execute pesquisas semânticas com vetores. Por exemplo, dado um conjunto de vetores, retorne as correspondências mais próximas em nosso banco de dados. Com a PNL, isso nos permite procurar frases semelhantes sem sermos limitados por palavras-chave exatas.
- Exporte seus dados em um formato compatível com a maioria dos pipelines de PNL (conjuntos de dados HuggingFace, pytorch, etc.)
- Armazene dados originais, extraindo e extraindo dados da API Understanding
- Campos de índice, parágrafos e sentenças semânticas no armazenamento de índice
- Extração de dados e insights na nuvem com Nuclia Understanding API™
- Conexão em nuvem para treinar modelos de ML com Nuclia Learning API™
- Sistema de segurança baseado em função com validação de autenticação de proxy upstream
- Recursos com vários campos e metadados
- Suporte a campos simples de texto/HTML/Markdown
- Tipos de campo: texto, arquivo, link, conversa
- Camada de armazenamento (PostgreSQL)
- Suporte a blob com API compatível com S3, GCS e Azure Blob Storage
- Replicação de armazenamento de índice
- Pesquisa distribuída
- Nativo da nuvem
Arquitetura
Início rápido
Experimentar o NucliaDB é super fácil! Você pode ampliar seus conhecimentos com as seguintes leituras:
- Início rápido!
- Leia sobre o que são as caixas de conhecimento em nossa seção de conceitos básicos
- Carregue seus dados
Comunidade
- Converse conosco no Slack
- Postagens de blog
- Siga-nos no X
- Você quer trabalhar conosco?
? Perguntas frequentes
Qual a diferença entre o NucliaDB e os mecanismos de busca tradicionais como Elasticsearch ou Solr?
A principal diferença e vantagem do NucliaDB é sua arquitetura construída desde o início para dados não estruturados. Seu índice vetorial, palavra-chave, gráfico e pesquisa difusa fornecem uma API para usar todas as informações extraídas e extraídas da Nuclia, Understanding API e fornece habilidades poderosas de PNL para qualquer aplicativo com baixo código e tranquilidade.
Qual licença o NucliaDB usa?
NucliaDB é de código aberto sob a Licença Pública Geral GNU Affero Versão 3 - AGPLv3. Fundamentalmente, isso significa que você está livre para usar o NucliaDB em seu projeto, desde que não modifique o NucliaDB. Se fizer isso, você deverá tornar as modificações públicas.
Qual é o modelo de negócios da Nuclia?
Nosso modelo de negócios depende de nossa API de normalização, esta é baseada em Nuclia Learning API
e Nuclia Understanding API
. Essas duas APIs oferecem transformação de dados não estruturados em dados compatíveis com NucliaDB com IA. Também oferecemos NucliaDB como serviço em nossa infraestrutura de provedor multinuvem: https://nuclia.cloud.
? Contribua e divulgue
Estamos sempre felizes em receber contribuições: código, documentação, problemas, feedback ou até mesmo dizer olá no Slack! Veja como você pode começar:
- Leia nosso Código de Conduta do Pacto do Colaborador
- Crie um fork do NucliaDB e envie sua solicitação pull!
E para agradecer por suas contribuições, reivindique seus brindes enviando-nos um e-mail para info em nuclia.com.
Referência
- Documentação Núclia
- Referência de API
meta
- Estilo de código de ferrugem
- Estilo de código Python
- Código de Conduta
- Contribuindo