Contoh kode untuk buku Pencarian Bertenaga AI oleh Trey Grainger, Doug Turnbull, dan Max Irwin. Diterbitkan oleh Manning Publications.
Penelusuran yang Didukung AI mengajarkan Anda teknik pembelajaran mesin terbaru untuk membangun mesin telusur yang terus belajar dari pengguna dan konten Anda untuk mendorong penelusuran yang lebih peka terhadap domain dan cerdas.
Teknologi mesin pencari berkembang pesat, dengan Kecerdasan Buatan (AI) yang mendorong sebagian besar inovasi tersebut. Relevansi crowdsourced dan integrasi model bahasa besar (LLM) seperti GPT dan model dasar lainnya mempercepat kemampuan dan ekspektasi teknologi penelusuran secara besar-besaran.
Penelusuran yang Didukung AI akan mengajari Anda teknik penelusuran modern berbasis ilmu data seperti:
Mesin pencari saat ini diharapkan cerdas, memahami nuansa kueri bahasa alami, serta preferensi dan konteks setiap pengguna. Buku ini memberdayakan Anda untuk membangun mesin pencari yang memanfaatkan interaksi pengguna dan hubungan semantik tersembunyi dalam konten Anda untuk secara otomatis memberikan pengalaman pencarian yang lebih baik dan relevan.
Untuk kemudahan penyiapan, semua kode dikirimkan dalam Notebook Jupyter dan dikemas dalam kontainer Docker. Ini berarti menginstal Docker dan kemudian menarik (atau membangun) dan menjalankan container Docker buku adalah satu-satunya pengaturan yang diperlukan. Lampiran A buku ini memberikan petunjuk langkah demi langkah lengkap untuk menjalankan contoh kode, namun Anda dapat menjalankan yang berikut ini untuk memulai dan menjalankannya dengan cepat:
Jika Anda belum menarik kode sumber secara lokal, jalankan:
git clone https://github.com/treygrainger/ai-powered-search.git
Kemudian, untuk membangun dan memulai basis kode dengan notebook Jupyter interaktif, jalankan:
cd ai-powered-search
docker compose up
Hanya itu yang diperlukan! Setelah container dibuat dan dijalankan (ini mungkin memakan waktu cukup lama, terutama pada build pertama), kunjungi: http://localhost:8888
untuk meluncurkan notebook Selamat Datang dan melihat Daftar Isi untuk semua contoh kode langsung dari seluruh buku.
Penelusuran yang Didukung AI mengajarkan banyak teknik penelusuran modern yang memanfaatkan pendekatan pembelajaran mesin. Meskipun kami menggunakan teknologi khusus untuk mendemonstrasikan konsep, sebagian besar teknik dapat diterapkan pada banyak mesin pencari modern dan database vektor.
Sepanjang buku ini, semua contoh kode menggunakan Python , dengan PySpark (antarmuka Python ke Apache Spark ) banyak digunakan untuk tugas pemrosesan data. Mesin pencari default yang digunakan oleh contoh-contoh dalam buku ini adalah Apache Solr , namun sebagian besar contoh disarikan dari mesin pencari tertentu, dan implementasi yang dapat ditukar akan segera tersedia untuk mesin pencari paling populer dan database vektor. Untuk informasi lebih lanjut tentang abstraksi mesin pencari dan integrasi khusus, lihat dokumentasi mesin.
Lihat Daftar Lengkap : Mesin Pencari dan Basis Data Vektor yang Didukung
[ Catatan : jika Anda bekerja untuk perusahaan mesin pencari / database vektor, proyek, atau penyedia hosting dan ingin bekerja sama dengan kami untuk mendapatkan dukungan mesin Anda, silakan hubungi [email protected] ]
Pembelian Pencarian yang Didukung AI oleh Anda mencakup akses online ke forum LiveBook Manning. Ini memungkinkan Anda memberikan komentar dan mengajukan pertanyaan tentang bagian mana pun dari buku ini. Selain itu, jangan ragu untuk mengirimkan permintaan penarikan, masalah Github, atau komentar pada repo resmi Github proyek di https://github.com/treygrainger/ai-power-search.
Semua kode dalam repositori ini adalah open source di bawah Lisensi Apache, Versi 2.0 (ASL 2.0), kecuali ditentukan lain.
Perhatikan bahwa saat menjalankan kode, kode tersebut mungkin menarik dependensi tambahan yang mengikuti lisensi alternatif, jadi pastikan untuk memeriksa lisensi tersebut sebelum menggunakannya dalam proyek Anda untuk memastikan lisensi tersebut sesuai. Kode ini juga dapat menarik kumpulan data yang tunduk pada berbagai lisensi, beberapa di antaranya mungkin berasal dari model AI dan beberapa di antaranya mungkin berasal dari perayapan web pada data yang tunduk pada penggunaan wajar berdasarkan undang-undang hak cipta di negara publikasi (AS) . Kumpulan data tersebut diterbitkan "sebagaimana adanya", dengan tujuan semata-mata untuk mendemonstrasikan konsep dalam buku ini, dan kumpulan data ini serta lisensi terkaitnya dapat berubah seiring berjalannya waktu.
Jika Anda belum memiliki salinannya, dukung penulis dan penerbit dengan membeli salinan Penelusuran yang Didukung AI . Ini akan memandu Anda langkah demi langkah melalui konsep dan teknik yang ditunjukkan dalam contoh kode di repositori ini, memberikan konteks dan wawasan yang diperlukan untuk membantu Anda lebih memahami teknik tersebut.