Codebeispiele für das Buch AI-Powered Search von Trey Grainger, Doug Turnbull und Max Irwin. Veröffentlicht von Manning Publications.
AI-Powered Search bringt Ihnen die neuesten Techniken des maschinellen Lernens bei, um Suchmaschinen zu erstellen, die kontinuierlich von Ihren Benutzern und Ihren Inhalten lernen, um eine domänenbewusstere und intelligentere Suche zu ermöglichen.
Die Suchmaschinentechnologie entwickelt sich rasant weiter, wobei künstliche Intelligenz (KI) einen Großteil dieser Innovationen vorantreibt. Crowdsourcing-Relevanz und die Integration großer Sprachmodelle (LLMs) wie GPT und anderer Basismodelle beschleunigen die Fähigkeiten und Erwartungen der Suchtechnologie enorm.
AI-Powered Search vermittelt Ihnen moderne, datenwissenschaftlich gestützte Suchtechniken wie:
Von heutigen Suchmaschinen wird erwartet, dass sie intelligent sind und die Nuancen von Suchanfragen in natürlicher Sprache sowie die Vorlieben und den Kontext jedes Benutzers verstehen. Dieses Buch befähigt Sie zum Aufbau von Suchmaschinen, die Benutzerinteraktionen und die verborgenen semantischen Beziehungen in Ihren Inhalten nutzen, um automatisch bessere und relevantere Sucherlebnisse zu liefern.
Um die Einrichtung zu vereinfachen, wird der gesamte Code in Jupyter-Notebooks geliefert und in Docker-Containern verpackt. Das bedeutet, dass nur die Installation von Docker und das anschließende Abrufen (oder Erstellen) und Ausführen der Docker-Container des Buches erforderlich sind. Anhang A des Buches enthält vollständige Schritt-für-Schritt-Anleitungen zum Ausführen der Codebeispiele. Sie können jedoch Folgendes ausführen, um schnell loszulegen:
Wenn Sie den Quellcode noch nicht lokal abgerufen haben, führen Sie Folgendes aus:
git clone https://github.com/treygrainger/ai-powered-search.git
Führen Sie dann Folgendes aus, um die Codebasis mit interaktiven Jupyter-Notebooks zu erstellen und zu starten:
cd ai-powered-search
docker compose up
Das ist alles was es braucht! Sobald die Container erstellt und ausgeführt werden (dies kann insbesondere beim ersten Build eine Weile dauern), besuchen Sie: http://localhost:8888
um das Willkommensnotizbuch zu starten und ein Inhaltsverzeichnis für alle Live-Codebeispiele aus dem gesamten anzuzeigen Buch.
AI-Powered Search vermittelt viele moderne Suchtechniken, die Ansätze des maschinellen Lernens nutzen. Während wir bestimmte Technologien verwenden, um Konzepte zu demonstrieren, sind die meisten Techniken auf viele moderne Suchmaschinen und Vektordatenbanken anwendbar.
Im gesamten Buch sind alle Codebeispiele in Python , wobei PySpark (die Python-Schnittstelle zu Apache Spark ) häufig für Datenverarbeitungsaufgaben genutzt wird. Die in den Beispielen des Buches verwendete Standardsuchmaschine ist Apache Solr , die meisten Beispiele sind jedoch von der jeweiligen Suchmaschine abstrahiert, und eine austauschbare Implementierung wird bald für die gängigsten Suchmaschinen und Vektordatenbanken verfügbar sein. Weitere Informationen zu den Suchmaschinenabstraktionen und benutzerdefinierten Integrationen finden Sie in der Suchmaschinendokumentation.
Siehe vollständige Liste : Unterstützte Suchmaschinen und Vektordatenbanken
[ Hinweis : Wenn Sie für ein Suchmaschinen-/Vektordatenbankunternehmen, ein Projekt oder einen Hosting-Anbieter arbeiten und mit uns an der Unterstützung Ihrer Suchmaschine arbeiten möchten, wenden Sie sich bitte an [email protected].]
Ihr Kauf von AI-Powered Search beinhaltet den Online-Zugriff auf Mannings LiveBook-Forum. Auf diese Weise können Sie Kommentare abgeben und Fragen zu beliebigen Teilen des Buches stellen. Darüber hinaus können Sie jederzeit Pull-Requests, Github-Probleme oder Kommentare zum offiziellen Github-Repo des Projekts unter https://github.com/treygrainger/ai-powered-search einreichen.
Der gesamte Code in diesem Repository ist Open Source unter der Apache-Lizenz, Version 2.0 (ASL 2.0), sofern nicht anders angegeben.
Beachten Sie, dass beim Ausführen des Codes möglicherweise zusätzliche Abhängigkeiten gezogen werden, die alternativen Lizenzen folgen. Überprüfen Sie diese Lizenzen daher unbedingt, bevor Sie sie in Ihren Projekten verwenden, um sicherzustellen, dass sie geeignet sind. Der Code kann auch Datensätze abrufen, die verschiedenen Lizenzen unterliegen, von denen einige aus KI-Modellen und einige aus Web-Crawlings von Daten abgeleitet sein können, die gemäß den Urheberrechtsgesetzen im Land der Veröffentlichung (USA) einer fairen Nutzung unterliegen. . Solche Datensätze werden „wie sie sind“ veröffentlicht und dienen ausschließlich der Demonstration der Konzepte im Buch. Diese Datensätze und die zugehörigen Lizenzen können sich im Laufe der Zeit ändern.
Wenn Sie noch kein Exemplar haben, unterstützen Sie bitte die Autoren und den Verlag, indem Sie ein Exemplar von AI-Powered Search erwerben. Es führt Sie Schritt für Schritt durch die Konzepte und Techniken, die in den Codebeispielen in diesem Repository gezeigt werden, und liefert den erforderlichen Kontext und Einblicke, damit Sie die Techniken besser verstehen können.