ตัวอย่างโค้ดสำหรับหนังสือ AI-Powered Search โดย Trey Grainger, Doug Turnbull และ Max Irwin จัดพิมพ์โดย สำนักพิมพ์แมนนิ่ง
การค้นหาที่ขับเคลื่อนด้วย AI สอนเทคนิคการเรียนรู้ของเครื่องล่าสุดเพื่อสร้างเครื่องมือค้นหาที่เรียนรู้อย่างต่อเนื่องจากผู้ใช้และเนื้อหาของคุณเพื่อขับเคลื่อนการค้นหาที่รับรู้ถึงโดเมนและชาญฉลาดมากขึ้น
เทคโนโลยีเครื่องมือค้นหามีการพัฒนาอย่างรวดเร็ว โดยปัญญาประดิษฐ์ (AI) ขับเคลื่อนนวัตกรรมดังกล่าวไปมาก ความเกี่ยวข้องของ Crowdsourced และการบูรณาการโมเดลภาษาขนาดใหญ่ (LLM) เช่น GPT และโมเดลพื้นฐานอื่นๆ กำลังเร่งความสามารถและความคาดหวังของเทคโนโลยีการค้นหาอย่างมหาศาล
การค้นหาที่ขับเคลื่อนด้วย AI จะสอนเทคนิคการค้นหาที่ขับเคลื่อนด้วยวิทยาศาสตร์ข้อมูลที่ทันสมัย เช่น:
เครื่องมือค้นหาในปัจจุบันได้รับการคาดหวังให้มีความชาญฉลาด โดยเข้าใจความแตกต่างของข้อความค้นหาที่เป็นภาษาธรรมชาติ ตลอดจนการตั้งค่าและบริบทของผู้ใช้แต่ละคน หนังสือเล่มนี้ช่วยให้คุณสร้างเครื่องมือค้นหาที่ใช้ประโยชน์จากการโต้ตอบของผู้ใช้และความสัมพันธ์ทางความหมายที่ซ่อนอยู่ในเนื้อหาของคุณ เพื่อมอบประสบการณ์การค้นหาที่ดีขึ้นและเกี่ยวข้องมากขึ้นโดยอัตโนมัติ
เพื่อความง่ายในการตั้งค่า โค้ดทั้งหมดจะจัดส่งใน Jupyter Notebooks และบรรจุในคอนเทนเนอร์ Docker ซึ่งหมายความว่าการติดตั้ง Docker จากนั้นการดึง (หรือการสร้าง) และการเรียกใช้คอนเทนเนอร์ Docker ของหนังสือเป็นเพียงการตั้งค่าที่จำเป็นเท่านั้น ภาคผนวก A ของหนังสือให้คำแนะนำทีละขั้นตอนสำหรับการรันตัวอย่างโค้ด แต่คุณสามารถรันสิ่งต่อไปนี้เพื่อเริ่มต้นและทำงานได้อย่างรวดเร็ว:
หากคุณยังไม่ได้ดึงซอร์สโค้ดในเครื่อง ให้รัน:
git clone https://github.com/treygrainger/ai-powered-search.git
จากนั้น หากต้องการสร้างและเริ่มต้นโค้ดเบสด้วยสมุดบันทึก Jupyter แบบโต้ตอบ ให้รัน:
cd ai-powered-search
docker compose up
เพียงเท่านี้! เมื่อสร้างและใช้งานคอนเทนเนอร์แล้ว (อาจใช้เวลาสักครู่ โดยเฉพาะอย่างยิ่งในรุ่นแรก) ให้ไปที่: http://localhost:8888
เพื่อเปิดใช้สมุดบันทึกต้อนรับ และดูสารบัญสำหรับตัวอย่างโค้ดที่ใช้งานจริงทั้งหมดจากทั่วทั้ง หนังสือ.
การค้นหาที่ขับเคลื่อนด้วย AI สอนเทคนิคการค้นหาสมัยใหม่มากมายโดยใช้ประโยชน์จากแนวทางการเรียนรู้ของเครื่อง แม้ว่าเราจะใช้เทคโนโลยีเฉพาะเพื่อแสดงแนวคิด แต่เทคนิคส่วนใหญ่ก็สามารถใช้ได้กับเครื่องมือค้นหาและฐานข้อมูลเวกเตอร์สมัยใหม่จำนวนมาก
ตลอดทั้งเล่ม ตัวอย่างโค้ดทั้งหมดอยู่ใน Python โดยที่ PySpark (อินเทอร์เฟซ Python ไปยัง Apache Spark ) ถูกใช้อย่างมากสำหรับงานประมวลผลข้อมูล เครื่องมือค้นหาเริ่มต้นที่ใช้ประโยชน์จากตัวอย่างของหนังสือคือ Apache Solr แต่ตัวอย่างส่วนใหญ่จะแยกออกจากเครื่องมือค้นหานั้น และการใช้งานแบบถอดเปลี่ยนได้จะพร้อมใช้งานในเร็วๆ นี้สำหรับเครื่องมือค้นหาและฐานข้อมูลเวกเตอร์ยอดนิยมส่วนใหญ่ สำหรับข้อมูลเพิ่มเติมเกี่ยวกับบทคัดย่อของเครื่องมือค้นหาและการบูรณาการแบบกำหนดเอง โปรดดูเอกสารประกอบของเครื่องมือค้นหา
ดูรายการทั้งหมด : เครื่องมือค้นหาที่รองรับและฐานข้อมูลเวกเตอร์
[ หมายเหตุ : หากคุณทำงานให้กับบริษัทเครื่องมือค้นหา / ฐานข้อมูลเวกเตอร์ โครงการ หรือผู้ให้บริการโฮสติ้ง และต้องการร่วมงานกับเราในการรับการสนับสนุนเครื่องมือค้นหาของคุณ โปรดติดต่อ [email protected] ]
การซื้อ AI-Powered Search ของคุณนั้นรวมถึงการเข้าถึงฟอรัม LiveBook ของ Manning ทางออนไลน์ ซึ่งจะทำให้คุณสามารถแสดงความคิดเห็นและถามคำถามเกี่ยวกับส่วนต่างๆ ของหนังสือได้ นอกจากนี้ โปรดส่งคำขอดึง ปัญหา Github หรือความคิดเห็นเกี่ยวกับ repo Github อย่างเป็นทางการของโปรเจ็กต์ได้ที่ https://github.com/treygrainger/ai-powered-search
โค้ดทั้งหมดในพื้นที่เก็บข้อมูลนี้เป็นโอเพ่นซอร์สภายใต้ Apache License เวอร์ชัน 2.0 (ASL 2.0) เว้นแต่จะระบุไว้เป็นอย่างอื่น
โปรดทราบว่าเมื่อรันโค้ด โค้ดอาจดึงการขึ้นต่อกันเพิ่มเติมที่เป็นไปตามสิทธิ์การใช้งานสำรอง ดังนั้นโปรดตรวจสอบให้แน่ใจว่าคุณได้ตรวจสอบสิทธิ์การใช้งานเหล่านั้นก่อนที่จะใช้ในโครงการของคุณเพื่อให้แน่ใจว่าเหมาะสม รหัสอาจดึงชุดข้อมูลภายใต้ใบอนุญาตต่างๆ ซึ่งบางส่วนอาจมาจากโมเดล AI และบางส่วนอาจมาจากการรวบรวมข้อมูลเว็บที่มีการใช้งานโดยชอบภายใต้กฎหมายลิขสิทธิ์ในประเทศที่เผยแพร่ (สหรัฐอเมริกา) . ชุดข้อมูลดังกล่าวได้รับการเผยแพร่ "ตามสภาพ" เพื่อจุดประสงค์เดียวในการสาธิตแนวคิดในหนังสือ และชุดข้อมูลเหล่านี้และใบอนุญาตที่เกี่ยวข้องอาจมีการเปลี่ยนแปลงเมื่อเวลาผ่านไป
หากคุณยังไม่มีสำเนา โปรดสนับสนุนผู้เขียนและผู้จัดพิมพ์โดยการซื้อสำเนาของ AI-Powered Search โดยจะแนะนำคุณทีละขั้นตอนผ่านแนวคิดและเทคนิคที่แสดงในตัวอย่างโค้ดในพื้นที่เก็บข้อมูลนี้ โดยให้บริบทและข้อมูลเชิงลึกที่จำเป็นเพื่อช่วยให้คุณเข้าใจเทคนิคได้ดีขึ้น