Exemples de code pour le livre AI-Powered Search de Trey Grainger, Doug Turnbull et Max Irwin. Publié par Manning Publications.
AI-Powered Search vous enseigne les dernières techniques d'apprentissage automatique pour créer des moteurs de recherche qui apprennent en permanence de vos utilisateurs et de votre contenu afin de générer une recherche plus intelligente et plus adaptée au domaine.
La technologie des moteurs de recherche évolue rapidement, l’intelligence artificielle (IA) étant à l’origine d’une grande partie de cette innovation. La pertinence du crowdsourcing et l'intégration de grands modèles de langage (LLM) comme GPT et d'autres modèles de base accélèrent considérablement les capacités et les attentes de la technologie de recherche.
La recherche basée sur l'IA vous apprendra des techniques de recherche modernes basées sur la science des données, telles que :
Les moteurs de recherche d'aujourd'hui doivent être intelligents, comprendre les nuances des requêtes en langage naturel, ainsi que les préférences et le contexte de chaque utilisateur. Ce livre vous permet de créer des moteurs de recherche qui tirent parti des interactions des utilisateurs et des relations sémantiques cachées dans votre contenu pour offrir automatiquement des expériences de recherche meilleures et plus pertinentes.
Pour simplifier la configuration, tout le code est expédié dans des notebooks Jupyter et emballé dans des conteneurs Docker. Cela signifie qu'installer Docker, puis extraire (ou créer) et exécuter les conteneurs Docker du livre est la seule configuration nécessaire. L'annexe A du livre fournit des instructions complètes étape par étape pour exécuter les exemples de code, mais vous pouvez exécuter ce qui suit pour être opérationnel rapidement :
Si vous n'avez pas encore extrait le code source localement, exécutez :
git clone https://github.com/treygrainger/ai-powered-search.git
Ensuite, pour créer et démarrer la base de code avec des notebooks Jupyter interactifs, exécutez :
cd ai-powered-search
docker compose up
C'est tout ce qu'il faut ! Une fois les conteneurs créés et exécutés (cela peut prendre un certain temps, en particulier lors de la première version), visitez : http://localhost:8888
pour lancer le bloc-notes de bienvenue et consulter une table des matières pour tous les exemples de code en direct provenant de tout le processus. livre.
AI-Powered Search enseigne de nombreuses techniques de recherche modernes tirant parti des approches d’apprentissage automatique. Bien que nous utilisions des technologies spécifiques pour démontrer des concepts, la plupart des techniques sont applicables à de nombreux moteurs de recherche et bases de données vectorielles modernes.
Tout au long du livre, tous les exemples de code sont en Python , PySpark (l'interface Python d' Apache Spark ) étant largement utilisé pour les tâches de traitement de données. Le moteur de recherche par défaut utilisé par les exemples du livre est Apache Solr , mais la plupart des exemples sont extraits du moteur de recherche particulier, et une implémentation échangeable sera bientôt disponible pour les moteurs de recherche et les bases de données vectorielles les plus populaires. Pour plus d'informations sur les abstractions du moteur de recherche et les intégrations personnalisées, consultez la documentation du moteur.
Voir la liste complète : moteurs de recherche et bases de données vectorielles pris en charge
[ Remarque : si vous travaillez pour une société, un projet ou un fournisseur d'hébergement de moteurs de recherche/de bases de données vectorielles et que vous souhaitez travailler avec nous pour faire prendre en charge votre moteur, veuillez contacter [email protected] ]
Votre achat de AI-Powered Search comprend un accès en ligne au forum LiveBook de Manning. Cela vous permet de formuler des commentaires et de poser des questions sur n’importe quelle partie du livre. De plus, n'hésitez pas à soumettre des demandes d'extraction, des problèmes Github ou des commentaires sur le dépôt Github officiel du projet à l'adresse https://github.com/treygrainger/ai-powered-search.
Tout le code de ce référentiel est open source sous la licence Apache, version 2.0 (ASL 2.0), sauf indication contraire.
Notez que lors de l'exécution du code, il peut extraire des dépendances supplémentaires qui suivent des licences alternatives. Assurez-vous donc d'inspecter ces licences avant de les utiliser dans vos projets pour vous assurer qu'elles sont adaptées. Le code peut également extraire des ensembles de données soumis à diverses licences, dont certaines peuvent être dérivées de modèles d'IA et d'autres peuvent être dérivées d'explorations Web de données soumises à une utilisation équitable en vertu des lois sur le droit d'auteur du pays de publication (États-Unis). . Tous ces ensembles de données sont publiés « tels quels », dans le seul but de démontrer les concepts présentés dans le livre, et ces ensembles de données et leurs licences associées peuvent être sujets à changement au fil du temps.
Si vous n'en avez pas encore un exemplaire, veuillez soutenir les auteurs et l'éditeur en achetant un exemplaire de AI-Powered Search . Il vous guidera étape par étape à travers les concepts et techniques présentés dans les exemples de code de ce référentiel, en vous fournissant le contexte et les informations nécessaires pour vous aider à mieux comprendre les techniques.