La base de données de recherche AI.
Démarrage rapide | Documents Nuclia | Communauté
NucliaDB est une base de données robuste qui permet de stocker et de rechercher des données non structurées.
Il s’agit d’une base de données de recherche hybride prête à l’emploi, utilisant des index vectoriels, de texte intégral et graphiques.
NucliaDB est écrit en Rust et Python. Nous l'avons conçu pour indexer de grands ensembles de données et fournir un support multi-locataires.
Lorsque vous utilisez NucliaDB avec Nuclia Cloud, vous bénéficiez de la puissance d'une base de données NLP sans les tracas liés à l'extraction, à l'enrichissement et à l'inférence de données. Nous faisons tout le travail pour vous.
Caractéristiques
- Stockez du texte, des fichiers, des vecteurs, des étiquettes et des annotations
- Effectuez des recherches de texte et, à partir d'un mot ou d'un ensemble de mots, renvoyez les ressources de notre base de données qui les contiennent.
- Effectuez des recherches sémantiques avec des vecteurs. Par exemple, étant donné un ensemble de vecteurs, renvoyez les correspondances les plus proches dans notre base de données. Avec la PNL, cela nous permet de rechercher des phrases similaires sans être limités par des mots-clés exacts.
- Exportez vos données dans un format compatible avec la plupart des pipelines NLP (ensembles de données HuggingFace, pytorch, etc.)
- Stocker les données originales, les extractions et les données extraites de l'API Understanding
- Champs d'index, paragraphes et phrases sémantiques sur le stockage d'index
- Extraction de données et d'informations dans le cloud avec Nuclia Understanding API™
- Connexion au cloud pour entraîner des modèles ML avec Nuclia Learning API™
- Système de sécurité basé sur les rôles avec validation d'authentification proxy en amont
- Ressources avec plusieurs champs et métadonnées
- Prise en charge des champs bruts Texte/HTML/Markdown
- Types de champs : texte, fichier, lien, conversation
- Couche de stockage (PostgreSQL)
- Prise en charge de Blob avec API compatible S3, GCS et Azure Blob Storage
- Réplication du stockage d'index
- Recherche distribuée
- Natif du cloud
Architecture
Démarrage rapide
Essayer NucliaDB est super simple ! Vous pouvez approfondir vos connaissances avec les lectures suivantes :
- Démarrage rapide !
- Découvrez ce que sont les boîtes de connaissances dans notre section Concepts de base
- Téléchargez vos données
Communauté
- Discutez avec nous dans Slack
- Articles de blog
- Suivez-nous sur X
- Voulez-vous travailler avec nous?
? FAQ
En quoi NucliaDB est-il différent des moteurs de recherche traditionnels comme Elasticsearch ou Solr ?
La principale différence et avantage de NucliaDB réside dans son architecture conçue dès le départ pour les données non structurées. Son index vectoriel, ses mots-clés, son graphique et sa recherche floue fournissent une API pour utiliser toutes les informations extraites et extraites de Nuclia, Understanding API et offrent de puissantes capacités NLP à toute application avec peu de code et une tranquillité d'esprit.
Quelle licence NucliaDB utilise-t-elle ?
NucliaDB est open source sous la licence publique générale GNU Affero version 3 - AGPLv3. Fondamentalement, cela signifie que vous êtes libre d'utiliser NucliaDB pour votre projet, tant que vous ne modifiez pas NucliaDB. Si vous le faites, vous devez rendre les modifications publiques.
Quel est le modèle économique de Nuclia ?
Notre modèle économique s'appuie sur notre API de normalisation, celle-ci est basée sur Nuclia Learning API
et Nuclia Understanding API
. Ces deux API offrent la transformation de données non structurées en données compatibles NucliaDB avec l'IA. Nous proposons également NucliaDB en tant que service sur notre infrastructure de fournisseur multi-cloud : https://nuclia.cloud.
? Contribuez et faites passer le message
Nous sommes toujours heureux d'avoir des contributions : code, documentation, problèmes, commentaires, ou même dire bonjour sur Slack ! Voici comment commencer :
- Lisez notre Code de conduite du Contributeur
- Créez un fork de NucliaDB et soumettez votre pull request !
Et pour vous remercier pour vos contributions, réclamez votre cadeau en nous envoyant un e-mail à info at nuclia.com.
Référence
- Documentation Nuclia
- Référence API
Méta
- Style de code antirouille
- Style de code Python
- Code de conduite
- Contribuer