Trey Grainger、Doug Turnbull 和 Max Irwin 所寫的《AI-Powered Search 》一書的程式碼範例。由曼寧出版社出版。
AI 支援的搜尋教您最新的機器學習技術來建立搜尋引擎,不斷向您的用戶和內容學習,以推動更多領域感知和智慧搜尋。
搜尋引擎技術正在迅速發展,人工智慧 (AI) 推動了大部分創新。眾包相關性以及 GPT 等大型語言模型 (LLM) 和其他基礎模型的整合正在極大地加速搜尋技術的能力和期望。
人工智慧驅動的搜尋將教您現代的、數據科學驅動的搜尋技術,例如:
今天的搜尋引擎應該是智慧的,能夠理解自然語言查詢的細微差別,以及每個使用者的偏好和上下文。本書使您能夠建立搜尋引擎,利用使用者互動和內容中隱藏的語義關係來自動提供更好、更相關的搜尋體驗。
為了簡化設置,所有程式碼都在 Jupyter Notebook 中提供並打包在 Docker 容器中。這意味著安裝 Docker,然後拉取(或建置)並運行本書的 Docker 容器是唯一必要的設定。本書的附錄 A 提供了運行程式碼範例的完整逐步說明,但您可以執行以下命令來快速啟動和運行:
如果您尚未在本地提取原始程式碼,請運行:
git clone https://github.com/treygrainger/ai-powered-search.git
然後,要使用互動式 Jupyter 筆記本建置並啟動程式碼庫,請執行:
cd ai-powered-search
docker compose up
這就是所需要的一切!容器建置並運行後(這可能需要一段時間,尤其是在第一次建置時),請造訪: http://localhost:8888
啟動歡迎筆記本並查看整個容器中所有即時程式碼範例的目錄。
人工智慧驅動的搜尋教授許多利用機器學習方法的現代搜尋技術。雖然我們利用特定技術來演示概念,但大多數技術適用於許多現代搜尋引擎和向量資料庫。
整本書中,所有程式碼範例均採用Python編寫,其中PySpark ( Apache Spark的 Python 介面)大量用於資料處理任務。本書範例使用的預設搜尋引擎是Apache Solr ,但大多數範例都是從特定搜尋引擎中抽像出來的,可交換實作很快將可用於大多數流行的搜尋引擎和向量資料庫。有關搜尋引擎抽象化和自訂整合的更多信息,請查看引擎文件。
查看完整列表:支援的搜尋引擎和向量資料庫
[注意:如果您在搜尋引擎/向量資料庫公司、專案或託管提供者工作,並希望與我們合作獲得您的引擎支持,請聯絡 [email protected] ]
您購買AI 支援的搜尋包括在線訪問 Manning 的 LiveBook 論壇。這使您可以對本書的任何部分提供評論並提出問題。此外,請隨時提交拉取請求、Github 問題或對專案官方 Github 儲存庫的評論:https://github.com/treygrainger/ai-powered-search。
除非另有說明,此儲存庫中的所有程式碼都是 Apache 授權版本 2.0 (ASL 2.0) 下的開源程式碼。
請注意,執行程式碼時,它可能會提取遵循備用許可證的其他依賴項,因此請務必在專案中使用這些許可證之前檢查它們,以確保它們合適。該程式碼還可能提取受各種許可證約束的資料集,其中一些可能源自人工智慧模型,其中一些可能源自於根據出版國(美國)版權法合理使用的資料的網路爬行。任何此類數據集均「按原樣」發布,其唯一目的是演示書中的概念,並且這些數據集及其相關許可可能會隨著時間的推移而變化。
如果您還沒有副本,請購買AI-Powered Search的副本來支持作者和出版商。它將逐步引導您了解此儲存庫中的程式碼範例中顯示的概念和技術,提供所需的上下文和見解,以幫助您更好地理解這些技術。