La base de datos de búsqueda de IA.
Inicio rápido | Documentos de Nuclia | Comunidad
NucliaDB es una base de datos robusta que permite almacenar y buscar datos no estructurados.
Es una base de datos de búsqueda híbrida lista para usar, que utiliza índices vectoriales, de texto completo y gráficos.
NucliaDB está escrito en Rust y Python. Lo diseñamos para indexar grandes conjuntos de datos y brindar soporte para múltiples inquilinos.
Al utilizar NucliaDB con la nube de Nuclia, podrá aprovechar el poder de una base de datos de PNL sin la molestia de la extracción, el enriquecimiento y la inferencia de datos. Hacemos todo el trabajo duro por usted.
Características
- Almacene texto, archivos, vectores, etiquetas y anotaciones.
- Realizar búsquedas de texto y dada una palabra o conjunto de palabras, devolver en nuestra base de datos recursos que las contengan.
- Realizar búsquedas semánticas con vectores. Por ejemplo, dado un conjunto de vectores, devolver las coincidencias más cercanas en nuestra base de datos. Con PNL, esto nos permite buscar oraciones similares sin estar limitados por palabras clave exactas.
- Exporte sus datos en un formato compatible con la mayoría de los canales de PNL (conjuntos de datos de HuggingFace, pytorch, etc.)
- Almacene datos originales, extrayendo datos extraídos de Understanding API
- Campos de índice, párrafos y oraciones semánticas sobre el almacenamiento de índice
- Extracción de información y datos en la nube con Nuclia Understanding API™
- Conexión a la nube para entrenar modelos de ML con Nuclia Learning API™
- Sistema de seguridad basado en roles con validación de autenticación de proxy ascendente
- Recursos con múltiples campos y metadatos.
- Compatibilidad con campos planos de texto/HTML/Markdown
- Tipos de campos: texto, archivo, enlace, conversación
- Capa de almacenamiento (PostgreSQL)
- Compatibilidad con blobs con API compatible con S3, GCS y Azure Blob Storage
- Replicación del almacenamiento de índices
- Búsqueda distribuida
- Nativo de la nube
Arquitectura
Inicio rápido
¡Probar NucliaDB es súper fácil! Puedes ampliar tus conocimientos con las siguientes lecturas:
- ¡Comienzo rápido!
- Lea sobre qué son las cajas de conocimiento en nuestra sección de conceptos básicos
- Sube tus datos
Comunidad
- Chatea con nosotros en Slack
- Publicaciones de blog
- Síguenos en X
- ¿Quieres trabajar con nosotros?
? Preguntas frecuentes
¿En qué se diferencia NucliaDB de los motores de búsqueda tradicionales como Elasticsearch o Solr?
La principal diferencia y ventaja de NucliaDB es su arquitectura construida desde cero para datos no estructurados. Su índice vectorial, palabras clave, gráficos y búsqueda difusa proporcionan una API para utilizar toda la información extraída y extraída de Nuclia, Understanding API y proporciona potentes capacidades de PNL para cualquier aplicación con poco código y tranquilidad.
¿Qué licencia utiliza NucliaDB?
NucliaDB es de código abierto bajo la licencia pública general GNU Affero versión 3 - AGPLv3. Básicamente, esto significa que eres libre de usar NucliaDB para tu proyecto, siempre y cuando no modifiques NucliaDB. Si lo haces, tienes que hacer públicas las modificaciones.
¿Cuál es el modelo de negocio de Nuclia?
Nuestro modelo de negocio se basa en nuestra API de normalización, esta se basa en Nuclia Learning API
y Nuclia Understanding API
. Estas dos API ofrecen transformación de datos no estructurados a datos compatibles con NucliaDB con IA. También ofrecemos NucliaDB como servicio en nuestra infraestructura de proveedores de múltiples nubes: https://nuclia.cloud.
? Contribuya y corra la voz
Siempre estamos felices de recibir contribuciones: código, documentación, problemas, comentarios o incluso saludar en Slack. Así es como puede comenzar:
- Lea nuestro Código de conducta del Pacto de Colaboradores
- ¡Cree una bifurcación de NucliaDB y envíe su solicitud de extracción!
Y para agradecerle por sus contribuciones, reclame su botín enviándonos un correo electrónico a info en nuclia.com.
Referencia
- Documentación Nuclia
- Referencia de API
Meta
- Estilo de código oxidado
- Estilo de código Python
- Código de conducta
- Contribuyendo