Pencarian Luar Biasa
Mendukung perjuangan Ukraina untuk kebebasan
KAPAL PERANG RUSIA, PERGI SENDIRI
Saya telah membangun aplikasi pencarian e-commerce selama hampir sepuluh tahun. Di bawah ini Anda dapat menemukan daftar (beberapa) publikasi, konferensi dan buku yang menginspirasi saya. Dikelompokkan berdasarkan topik (Jika sebuah artikel masuk ke dalam beberapa topik - artikel tersebut terbagi menjadi beberapa bagian).
Bintangi kami di GitHub — ini membantu!
Periksa juga koleksi saya yang lain e-commerce yang luar biasa, grafik pengetahuan yang luar biasa, aplikasi cloud yang luar biasa
Topik
- Umum, menyenangkan, filosofi
- Jenis pencarian
- Pencarian Klasik/leksikal
- Pencarian Vektor/Semantik
- Penyematan
- Jenis vektor
- Vektor padat
- Vektor jarang
- Model pembuat enkode
- Arsitektur utama
- Interaksi token Kueri/Dokumen
- Tidak ada interaksi - Dua menara / Bi-encoder
- Interaksi awal - Cross-encoder
- Interaksi terlambat - ColBERT
- Menangani embeddings berdimensi tinggi
- Pengurangan dimensi
- Kuantisasi
- Kuantisasi skalar
- Kuantisasi biner
- Pencarian semantik Simetris dan Asimetris
- Pencarian hibrida
- Penggabungan peringkat timbal balik - RRF
- Pencarian multimoda
- Area aplikasi
- Pencarian perusahaan
- pencarian e-niaga
- Pencarian percakapan
- Pencarian Geo-Spasial
- Pencarian Medis dan Kesehatan
- Media Sosial dan Pencarian Konten Buatan Pengguna
- Sistem Penjawab Pertanyaan
- Manajemen Informasi Pribadi
- Hasil Pencarian
- Pengambilan
- Peringkat
- Pemeringkatan multi tahap
- Belajar Memberi Peringkat
- Klik model untuk pencarian
- Bias
- Diversifikasi
- Personalisasi
- Hasil pencarian nol
- Cari UX
- Institut Baymard
- Grup Nielsen Norman
- Pengetahuan Perusahaan LLC
- Aspek
- Ahli Taksonomi yang Tidak Disengaja
- Lainnya
- Koreksi ejaan
- Saran
- Sinonim
- kata-kata penghenti
- Grafik/Taksonomi/Grafik Pengetahuan
- Mengintegrasikan Pencarian dan Grafik Pengetahuan (berdasarkan Pengetahuan Perusahaan)
- Perluasan kueri
- Pemahaman pertanyaan
- Maksud Pencarian
- Segmentasi kueri
- Algoritma
- BERT
- ColBERT
- Kolokasi, frasa umum
- Algoritma Lainnya
- Pelacakan, pembuatan profil, GDPR, Analisis
- Eksperimen
- Mengevaluasi pencarian
- MRR
- Pengujian, metrik, KPI
- Mengevaluasi Pencarian (oleh Daniel Tunkelang)
- Mengukur Pencarian (oleh James Rubinstein)
- Tiga Pilar Relevansi Pencarian (oleh Andreas Wagner)
- Arsitektur
- Pencarian vektor
- Pendidikan dan jaringan
- Konferensi
- Pelatihan dan kursus
- Buku
- Blog dan Portal, Berita
- Dokumen
- Manajemen, Tim Pencarian
- Pelaku industri
- Kepribadian dan influencer
- Mesin Pencari
- Produk dan layanan
- Perusahaan konsultan
- Seri postingan blog
- Optimasi Pencarian 101 (oleh Charlie Hull)
- Pemahaman Query (oleh Daniel Tunkelang)
- Dinamika Jaringan
- Mempertimbangkan Penelusuran: Topik Penelusuran (oleh Derek Sisson)
- Video
- Studi kasus
- Pencarian umum
- Pasar multisisi
- perdagangan elektronik
- Kumpulan data
- Peralatan
Tidak disortir
- kotak pasir Juni 2021
- kotak pasir Mei 2021
- kotak pasir April 2021
- kotak pasir Des 2020
- kotak pasir Januari 2020
Umum, menyenangkan, filosofi
- Kebohongan yang Dipercaya Pemrogram Tentang Pencarian
- Pencarian Etis: Merancang perjalanan menarik dengan dampak positif
- Tentang Pencarian Semantik
- Hutang umpan balik: apa yang diajarkan segway kepada tim pencari
- Mendukung Perjalanan Pencari: Kapan dan Bagaimana
- Belanja Itu Sulit, Ayo Mencari!
- Pengantar Kualitas Pencarian
- Pola Desain Pencarian Di Tempat untuk E-Commerce: Struktur Skema, Pemeringkatan Berdasarkan Data & Lainnya
- Mencari Penarikan Kembali
- Seimbangkan Anggaran Pencarian Anda!
Jenis pencarian
- Evolusi Teknologi Penelusuran: Pandangan ke Depan
Pencarian Klasik/Leksikal
- Etsy. Menargetkan Kueri Luas dalam Penelusuran
- Bagaimana Etsy Menggunakan Termodinamika untuk Membantu Anda Mencari “Geeky”
- Kueri Penelusuran yang Luas dan Ambigu
- Mendekonstruksi Pencarian E-Commerce: 12 Jenis Kueri
Pencarian Vektor/Semantik
Bermigrasi ke Elasticsearch dengan vektor padat untuk mesin pencari Carousell Spotlight
Dari model penyematan pencarian nol hingga pencarian semantik
Pedoman untuk memilih indeks
Seri Biji Pinus
- Indeks Tetangga Terdekat untuk Pencarian Kesamaan
- Klausul WHERE yang Hilang dalam Pencarian Vektor
Inovasi Pengalaman Pencarian dengan Amazon OpenSearch dan Amazon Bedrock
Pencarian semantik Simetris dan Asimetris
- Pencarian Semantik Simetris vs. Asimetris
Penyematan
Jenis
- Bi-encoder vs Cross encoder? Kapan menggunakan yang mana?
- Apa itu ColBERT dan Interaksi Terlambat dan Mengapa Penting dalam Penelusuran?
Model pembuat enkode
- Memilih model terbaik untuk pencarian semantik
Interaksi token Kueri/Dokumen
Tidak ada interaksi - Dua menara / Bi-encoder
Interaksi awal - Cross-encoder
Interaksi terlambat - ColBERT
- Mengumumkan penyematan Vespa ColBERT
- Apa itu ColBERT dan Interaksi Terlambat dan Mengapa Penting dalam Penelusuran?
Vektor Padat
Penyematan Matryoshka
- Penyematan Matryoshka: pencarian vektor OpenAI yang lebih cepat menggunakan Adaptive Retrieval
- Pengantar Model Penyematan Matryoshka
- Representasi Matryoshka. Panduan untuk pencarian semantik yang lebih cepat
Vektor Jarang
SPLADE
- Pencarian Hibrid: SPLADE (Sparse Encoder)
- SPLADE untuk Pencarian Vektor Jarang Dijelaskan
Menangani embeddings berdimensi tinggi
Pengurangan dimensi
Kuantisasi
Penyematan biner
Pencarian hibrida
- Pencarian hibrid > jumlah bagian-bagiannya?
- Pada Pencarian Hibrid
- Pencarian hibrid dengan pemeringkatan ulang
Penggabungan peringkat timbal balik (RRF)
- Pencarian hibrid dengan pemeringkatan ulang
- Penggabungan peringkat timbal balik
Pencarian multimoda
- Muves: Pencarian vektor multimodal & multibahasa dengan Akselerasi Perangkat Keras
- Pemilihan Model untuk Pencarian Multimodal
Area aplikasi
Pencarian perusahaan
- GenAI Dapat Meningkatkan Pencarian Perusahaan, Namun Masih Dalam Proses
pencarian e-niaga
- Pengaruh algoritma TF-IDF dalam pencarian eCommerce
Pencarian percakapan
- Telusuri sebagai Percakapan
- Keterjangkauan untuk Pencarian Percakapan
- Pemahaman Kueri dan Chatbots
Hasil Pencarian
Pengambilan
Relevansi
- Manusia Mencari Sesuatu, Bukan String
- Apa yang dimaksud dengan Hasil Pencarian 'Relevan'?
- Cara Mencapai Relevansi Pencarian E-niaga
- Menyiapkan program evaluasi relevansi
Algoritma Relevansi
- Memahami algoritma pencarian teks lengkap BM25
- BM25 Praktis: Bagaimana Pecahan Mempengaruhi Penilaian Relevansi di Elasticsearch, Algoritma BM25 dan Variabelnya
- Pengaruh algoritma TF-IDF dalam pencarian eCommerce
- BM25 Generasi Berikutnya Relevansi Lucene
- Kesamaan Lucene (BM25, DFR, DFI, IB, LM) Dijelaskan
Peringkat
Pemeringkatan multi-tahap
- Pemeringkatan multi tahap
Belajar Memberi Peringkat
- Apa perbedaan penelusuran dengan masalah pembelajaran mesin lainnya?
- Pembelajaran penguatan membantu peringkat pencarian
- Pemeringkatan Ulang Penelusuran E-niaga sebagai Masalah Pembelajaran Penguatan
- Kapan menggunakan mesin yang dipelajari vs. pemeringkat pencarian berbasis skor
- Apa itu Belajar Memberi Peringkat?
- Menggunakan AI dan Pembelajaran Mesin untuk Mengatasi Bias Posisi dalam Pencarian Saham Adobe
- Pemisahan Set Pelatihan dan Pengujian untuk Mengevaluasi Pembelajaran Untuk Memberi Peringkat Model
- Cara kerja LambdaMART - mengoptimalkan sasaran peringkat produk
Klik model untuk pencarian
- Klik model
- Klik Pemodelan untuk eCommerce
- Menggunakan Data Perilaku untuk Meningkatkan Pencarian
Bias
- Apa itu Bias Presentasi dalam pencarian?
- Mengatasi Bias Posisi dalam Rekomendasi dan Pencarian
Diversifikasi
- Diversifikasi Hasil Pencarian menggunakan Model Bahasa Kausal
- Belajar Mendiversifikasi Pencarian E-commerce dengan Multi-Armed Bandit
- Kualitas Pencarian untuk Penemuan & Inspirasi
- Bagaimana mengukur Keanekaragaman Hasil Pencarian
- Mencari Goldilock
- Kueri Penelusuran yang Luas dan Ambigu - Mengenali Saat Hasil Penelusuran Membutuhkan Diversifikasi
- Pemikiran tentang Keanekaragaman Hasil Pencarian
Personalisasi
- Pola Personalisasi dalam Rekomendasi dan Pencarian
- Personalisasi Daniel Tunkelang
- Airbnb - Personalisasi real-time dalam pencarian
- 98 titik data pribadi yang digunakan facebook untuk menargetkan iklan kepada Anda
- Arsitektur sistem rekomendasi dunia nyata
- Rekayasa fitur untuk pencarian yang dipersonalisasi
Hasil pencarian nol
- Strategi untuk menggunakan kueri alternatif untuk mengurangi hasil nol dan penerapannya pada pasar online
- Kesetaraan Semantik Kueri e-Commerce
Cari UX
Institut Baymard
- Mendekonstruksi Pencarian E-Commerce: 12 Jenis Kueri
- Arahkan Otomatis atau Pandu Pengguna ke Kategori yang Cocok
- 13 Pola Desain untuk Saran Pelengkapan Otomatis (27% Salah)
- Pencarian E-Commerce Perlu Mendukung Kueri Pencarian Non-Produk Pengguna (15% Tidak)
- Pencarian UX: 6 Elemen Penting untuk Halaman 'Tidak Ada Hasil'
- Thumbnail Produk Harus Diperbarui Secara Dinamis agar Sesuai dengan Variasi yang Dicari (54% Tidak)
- Penyortiran Segi - Metode Baru untuk Menyortir Hasil Pencarian
- Keadaan Pencarian E-Commerce Saat Ini
- Situs E-Commerce Membutuhkan Beberapa dari 5 Fitur 'Cakupan Pencarian' Ini
- Desain Bidang Pencarian E-Commerce dan Implikasinya
- Situs E-Commerce Harus Menyertakan Cuplikan Pencarian Kontekstual (96% Salah)
- Kegunaan Pencarian E-Commerce: Laporan & Tolok Ukur
- Enam Peningkatan UX E-Commerce Terkait 'COVID-19' yang Harus Dilakukan
Grup Nielsen Norman
- Pola Tatapan Cinta pada Pandangan Pertama di Halaman Hasil Pencarian
- Pengabaian yang Baik di Halaman Hasil Pencarian
- Halaman Hasil Pencarian Kompleks Mengubah Perilaku Pencarian: Pola Pinball
- Saran Pencarian Situs
- Analisis Log Pencarian: Peluang yang Paling Diabaikan dalam Riset Web UX
- Pencarian Cakupan: Berbahaya, tapi Terkadang Bermanfaat
- 3 Pedoman untuk Halaman "Tidak Ada Hasil" Mesin Pencari
Pengetahuan Perusahaan LLC
- Mengoptimalkan Pengalaman Penelusuran Anda: Pendekatan Desain Penelusuran yang Berpusat pada Manusia
Aspek
- Aspek Pencarian Segi
- Kopi, Kopi, Kopi!
- Pencarian Segi (mulai di sini!)
- Bagaimana menerapkan pencarian segi dengan cara yang benar
- Metadata dan Pencarian Segi
- Metacrap: Menyalakan obor kepada tujuh manusia jerami dari meta-utopia
- 7 Implementasi Penyaringan yang Menjadikan Macy Terbaik di Kelasnya
- Pencarian Segi: Panduan Paling Komprehensif. Praktik Terbaik, Pola Desain, Peringatan Tersembunyi, dan Solusinya
- Aspek: Kendala atau Preferensi?
- Aspeknya, Tapi Yang Mana?
Ahli Taksonomi yang Tidak Disengaja
- Berapa Banyak Aspek yang Harus Dimiliki Taksonomi
- Ketika Taksonomi Tidak Harus Hierarki
- Menyesuaikan Aspek Taksonomi
Lainnya
- Belajar dari Gesekan untuk Meningkatkan Pengalaman Pencarian
- Mengapa begitu sulit mengurutkan berdasarkan harga?
- Penyortiran Segi
- Google mematikan Pencarian Instan
Koreksi ejaan
- Peter Norvig. "Cara Menulis Korektor Ejaan". Publikasi klasik.
- Daniel Tunkelang. "Koreksi Ejaan"
- Pemeriksa ejaan sederhana yang dibuat dari vektor kata
- Melihat lebih dekat masalah koreksi ejaan: 1, 2, 3, preDict
- Ejaan Mendalam
- Pemodelan Koreksi Ejaan untuk Pencarian di Etsy
- Serigala Garbe. Penulis Sympell. Algoritme Koreksi Ejaan 1000x Lebih Cepat, Sorotan teratas SymSpell vs. BK-tree: pencarian string fuzzy & pemeriksaan ejaan 100x lebih cepat, Segmentasi Kata Cepat pada Teks Bising
- Chars2vec: model bahasa berbasis karakter untuk menangani teks dunia nyata dengan kesalahan ejaan dan
- JamSpell, koreksi ejaan dengan mempertimbangkan konteks sekitar - perpustakaan, (dalam bahasa Rusia) Исправляем опечатки с учётом контекста
- Penyematan untuk koreksi ejaan
- Pemeriksa ejaan sederhana yang dibuat dari vektor kata
- Apa sajakah algoritma koreksi ejaan yang digunakan oleh mesin pencari?
- Moman - koreksi ejaan lucene/solr/elasticsearch/koreksi otomatis (dulu?) sebenarnya didukung oleh perpustakaan ini.
- Segmentasi Kueri dan Koreksi Ejaan
- Menerapkan Pemeriksaan Ejaan Sadar Konteks di Spark NLP
- Koreksi otomatis di Google, Amazon, dan Pinterest dan cara menulisnya sendiri
Sinonim
- Meningkatkan kekuatan Elasticsearch dengan sinonim
- Pembicaraan Nyata Tentang Sinonim dan Pencarian
- Sinonim dalam Solr I — Yang baik, yang buruk dan yang jelek
- Sinonim dan Antonim dari WordNet
- Sinonim dan Antonim dengan Python
- Selami WordNet dengan NLTK
- Menciptakan Pencarian Lebih Baik Melalui Deteksi Sinonim Otomatis
- Sinonim multikata dalam pencarian menggunakan Querqy
- Cara Membangun Model Sinonim yang Cerdas
- Pentingnya Sinonim dalam Pencarian eCommerce
kata-kata penghenti
- Apakah pertanyaan all-stopword penting?
Saran
Sinonim: pelengkapan otomatis, cari sambil mengetik, saran
- Giovanni Fernandez-Kincade. Bootstrapping Autosuggest, Membangun Korpus Autosuggest, Bagian 1, Membangun Korpus Autosuggest, Bagian 2, Struktur & Algoritma Pengambilan Data Autosuggest, Pemeringkatan Autosuggest
- Pada dua jenis saran
- Meningkatkan Saran Pencarian untuk eCommerce
- Praktik Terbaik Penelusuran Pelengkapan Otomatis untuk Meningkatkan Konversi
- Mengapa kami mengembangkan modul smartSuggest searchhub dan mengapa hal itu mungkin penting bagi Anda
- Nielsen Norman Group: Saran Pencarian Situs
- 13 Pola Desain untuk Saran Pelengkapan Otomatis
- Pelengkapan otomatis
- Pelengkapan Otomatis dan Pengalaman Pengguna
- MENERAPKAN LINKEDIN LIKE SEARCH SEBAGAI MENGETIK DENGAN ELASTICSEARCH
- Praktik terbaik pelengkapan otomatis yang cerdas: meningkatkan relevansi penelusuran dan penjualan
- OLX: Membangun Corpus untuk AutoSuggest (Bagian 1), Pengambilan & Pemeringkatan AutoSuggest (Bagian 2)
- Pelengkapan Otomatis, Saran Pencarian Langsung, dan Koreksi Otomatis: Pola Desain Praktik Terbaik
- Cermin, Cermin, Apa yang Saya Ketik Selanjutnya? Semua Tentang Saran Pencarian
- Bagaimana kami membuat saran otomatis secepat kilat untuk otto.de
Grafik/Taksonomi/Grafik Pengetahuan
Grafik pengetahuan diterapkan di industri ritel
Grafik pengetahuan menjadi semakin populer di bidang teknologi. Kami mengeksplorasi bagaimana mereka dapat digunakan dalam industri ritel untuk memperkaya data, memperluas hasil pencarian, dan menambah nilai bagi perusahaan ritel.
Grafik Pengetahuan yang Luar Biasa
Mengintegrasikan Pencarian dan Grafik Pengetahuan (berdasarkan Pengetahuan Perusahaan)
- Bagian 1: Menampilkan Hubungan
- Perluasan kueri penelusuran dengan penyematan kueri
Perluasan kueri
- Dasar-dasar penulisan ulang kueri (bagian 1): pengenalan perluasan kueri
Pemahaman pertanyaan
- Pemahaman Pertanyaan Daniel Tunkelang.
- Pemahaman Query, Dibagi Menjadi Tiga Bagian
- Cari Hal bukan String
- Memahami Permintaan Pencarian. Bagian 1, Bagian 2, Bagian 3
- Penemuan Makanan dengan Uber Eats: Membangun Mesin Pemahaman Kueri
- AI untuk Pemahaman Kueri
Maksud Pencarian
- Memetakan Kueri Pencarian ke Maksud Pencarian
- Pencarian: Niat, Bukan Inventaris
Segmentasi kueri
- Segmentasi Kueri Tanpa Pengawasan Kertas Hanya Menggunakan Log Kueri
- Makalah Menuju Segmentasi Kueri Semantik
Algoritma
BERT
- Memahami BERT dan Relevansi Pencarian
- Google meningkatkan penelusuran web dengan BERT – bisakah kita menggunakannya untuk penelusuran perusahaan juga?
ColBERT
- Model Bahasa Transformer yang Telah Dilatih untuk Penelusuran - bagian 3
Kolokasi, frasa umum
- Secara otomatis mendeteksi frasa umum – ekspresi multi-kata / kata n-gram – dari rangkaian kalimat.
- Efektivitas Kolokasi yang Tidak Masuk Akal
Algoritma Lainnya
- Satu pengkodean panas
- Menulis mesin pencari teks lengkap menggunakan filter Bloom
hashing
- Hashing Sensitif Lokalitas
- Locality Sensitive Hashing (LSH): Panduan Praktis dan Bergambar
- Minhash
Menyortir berdasarkan peringkat rata-rata
- Lebih Baik dari Rata-Rata: Urutkan berdasarkan Peringkat Terbaik
- Bagaimana Tidak Mengurutkan Berdasarkan Peringkat Rata-Rata
Ekstraksi kata kunci
- Ekstraksi Kata Kunci menggunakan RAKE
- Ekstraktor Kata Kunci Lain (Yake)
- Ekstraksi Kata Kunci dengan BERT
Pelacakan, pembuatan profil, GDPR, Analisis
Alat, platform, pembantu untuk pelacakan pencarian
- Wawasan Perilaku Pengguna OpenSearch
- Pelacakan Penelusuran Situs dengan Google Analytics 4
- Bajak salju
- pencari-kolektor
- OpenTelemetry dengan tambahan pencarian
- Analisis Kueri Pulsa
- Melacak siapa yang hot dan siapa yang tidak menghadirkan tantangan algoritmik
Sumber daya
- Anonimisasi: mengelola risiko perlindungan data (kode praktik)
- Kerangka Pengambilan Keputusan Anonimisasi
- 98 titik data pribadi yang digunakan facebook untuk menargetkan iklan kepada Anda
- Analisis Peluang untuk Pencarian
- Wajah Diekspos untuk Pencari AOL No.4417749
- Kebocoran data pencarian AOL
- Data pribadi
Eksperimen
- Kesalahan Umum dalam Eksperimen Penelusuran
- Meningkatkan Penelusuran @scale dengan eksperimen kueri yang efisien
Pengujian A/B, MAB
- Pengujian A/B untuk Penelusuran Berbeda
- Penelusuran Pengujian A/B: berpikir seperti ilmuwan
Pengujian, metrik, KPI
Metrik
- Keuntungan kumulatif yang didiskon
- Rasa NDCG - dinormalisasi menjadi apa!?
- Berarti peringkat timbal balik
- P@k
- Mengungkap nDCG dan ERR
- Memilih metrik evaluasi relevansi penelusuran Anda
- Cara Menerapkan Pencetak Kualitas Peringkat Keuntungan Kumulatif Diskon Ternormalisasi (NDCG) di Quepid
- https://en.wikipedia.org/wiki/Precision_and_recall
- https://en.wikipedia.org/wiki/F1_score
- Memvisualisasikan metrik pencarian
- Memilih metrik evaluasi relevansi penelusuran Anda
- Hitung Mean Reciprocal Rank (MRR) menggunakan Pandas
- Sistem Rekomendasi: Metrik Pembelajaran Mesin dan Metrik Bisnis
KPI
- 5 Cara Tepat untuk Mengukur Kinerja Pencarian
- KPI Penelusuran Situs E-niaga. Bagian 1 – Pelanggan, Bagian 2 – Produk, Bagian 3 – Pertanyaan
- Belajar dari Gesekan untuk Meningkatkan Pengalaman Pencarian
- Di Balik Keajaiban Pengalaman Pencarian yang Mulus
- Menganalisis metrik relevansi pencarian online dengan Elastic Stack
- Cara Mendapatkan Wawasan Dari Analisis Penelusuran
Mengevaluasi Pencarian (oleh Daniel Tunkelang)
- Ukurlah
- Mengukur Perilaku Pencari
- Menggunakan Penilaian Manusia
- Ketika Tidak Ada Tingkat Konversi
Mengukur Pencarian (oleh James Rubinstein)
- Pendekatan statistik dan berpusat pada manusia untuk peningkatan mesin pencari
- Pendekatan Manusia
- Menyiapkan program evaluasi relevansi
- Metrik Penting
- Penelusuran Pengujian A/B: berpikir seperti ilmuwan
- Triase Kueri: Senjata Rahasia untuk Relevansi Pencarian
- Tinjauan Peluncuran: menyatukan semuanya…
Tiga Pilar Relevansi Pencarian (oleh Andreas Wagner)
- Bagian 1: Kemampuan untuk Ditemukan
- bagian 2: Kualitas Pencarian Untuk Penemuan & Inspirasi
Arsitektur
- Seni Abstraksi – Meninjau Kembali Arsitektur Toko Web
- Canva - Saluran Pencarian
- Bagian Kesatu menguraikan tantangan yang dihadapi
- Bagian Kedua arsitektur pencarian baru
- Arsitektur Berbasis Peristiwa untuk Pengindeksan Pencarian yang Efisien
Pendidikan dan jaringan
Konferensi
- Mengaktifkan
- Kata kunci Berlin
- tumpukan jerami
- elastis{ON}
- PENCARIAN E-COMMERCE MIX-CAMP
- SIGIR eCommerce
Pelatihan dan kursus
Penelusuran yang Didukung Pembelajaran Mesin. Doug Turnbull Berikutnya: 24 Januari 2023
Koneksi Sumber Terbuka
- Elasticsearch "Berpikir Seperti Insinyur Relevansi"
- Solr "Berpikir Seperti Insinyur Relevansi"
- Melampaui Relevansi Penelusuran: Memahami dan Mengukur Kualitas Hasil Penelusuran
- Halo LTR
pelatihan Sease
Dasar-dasar Pencarian. Daniel Tunkelang, Grant Ingersoll Berikutnya: 6 Februari 2023
Telusuri dengan Pembelajaran Mesin. Daniel Tunkelang, Grant Ingersoll Berikutnya: 27 Februari 2023
Cari Manajer Produk. Daniel Tunkelang Berikutnya: 3 April 2023
Pelatihan Solr, Elasticsearch, dan OpenSearch Sematext
Musim Gugur 2023
https://dtunkelang.medium.com/upcoming-search-classes-this-fall-58f877fe00ad
Buku
- Pencarian bertenaga AI
- Pencarian yang Relevan
- Pembelajaran Mendalam untuk pencarian
- Interaksi dengan sistem pencarian
- Penyematan dalam Pemrosesan Bahasa Alami. Teori dan Kemajuan dalam Representasi Makna Vektor
- Cari Antarmuka Pengguna
- Pola Pencarian
- Analisis Penelusuran untuk Situs Anda: Percakapan dengan Pelanggan Anda
- Klik Model untuk Pencarian Web
- Algoritma Optimasi
Blog dan Portal
Dokumen
Manajemen, Tim Pencarian
- Pencarian adalah Olahraga Tim
- Pemikiran tentang Mengelola Tim Pencarian
- Tentang Kepemimpinan Pencarian
- Membangun Tim Penelusuran yang Efektif: kunci penelusuran & relevansi yang hebat
- Triase Kueri: Senjata Rahasia untuk Relevansi Pencarian
- Tinjauan Peluncuran: menyatukan semuanya
- Peran Pemilik Produk Penelusuran
- Manajemen Produk Penelusuran: Peran yang Paling Disalahpahami dalam Penelusuran?
- Relevansi pencarian untuk tim yang kekurangan staf
Wawancara Kerja
- Pertanyaan Wawancara untuk Insinyur Relevansi Penelusuran, Ilmuwan Data, dan Manajer Produk
- Wawancara Ilmu Data: Pemeringkatan dan pencarian
Rekayasa
- Hutang teknis dalam pencarian
Seri postingan blog
Optimasi Pencarian 101 (oleh Charlie Hull)
- Bagaimana saya tahu bahwa pencarian saya rusak?
- Apa artinya jika penelusuran saya 'rusak'?
- Bagaimana cara memperbaiki pencarian yang rusak?
- Mengurangi risiko bisnis dengan mengoptimalkan pencarian
Pemahaman Query (oleh Daniel Tunkelang)
Pencarian yang lebih baik melalui pemahaman kueri.
- Sebuah Pengantar
- Identifikasi Bahasa
- Penyaringan Karakter
- Tokenisasi
- Koreksi Ejaan
- Stemming dan Lemmatisasi
- Penulisan Ulang Kueri: Gambaran Umum
- Perluasan Kueri
- Relaksasi Kueri
- Segmentasi Kueri
- Pelingkupan Kueri
- Pengakuan Entitas
- Taksonomi dan Ontologi
- Pelengkapan otomatis
- Pelengkapan Otomatis dan Pengalaman Pengguna
- Pemahaman Kueri Kontekstual: Suatu Tinjauan
- Konteks Sesi
- Lokasi sebagai Konteks
- Musiman
- Personalisasi
- Telusuri sebagai Percakapan
- Dialog Klarifikasi
- Umpan Balik Relevansi
- Pencarian Segi
- Presentasi Hasil Pencarian
- Cuplikan Hasil Pencarian
- Pengelompokan Hasil Pencarian
- Menjawab Pertanyaan
- Pemahaman Kueri dan Antarmuka Suara
- Pemahaman Kueri dan Chatbots
Dinamika Jaringan
- Bukan mesin pencari ayahmu: sejarah singkat pencarian ritel
- Pencarian vektor semantik: batas baru dalam penemuan produk
- Meningkatkan penemuan produk dengan pencarian semantik
- Cetak biru penguraian kueri semantik
Mempertimbangkan Penelusuran: Topik Penelusuran (oleh Derek Sisson)
- Pendahuluan
- Asumsi Tentang Pencarian
- Asumsi Tentang Perilaku Pencarian Pengguna
- Jenis Pengumpulan Informasi
- Pandangan Struktural pada Penelusuran
- Pengguna dan Tugas Pengambilan Informasi
- Pengujian Pencarian
- Tautan Pencarian dan Referensi yang Berguna
Pelaku industri
Kepribadian dan influencer
- Daniel Tunkelang (dia adalah Dewa Pencarian)
- Max Irwin
- Doug Turnbull
- Institut Baymard
Mesin Pencari
- Google
- Bing
- Yandex
- Amazon
- eBay
Produk dan layanan
- Algolia
- Vespa
- Elasticsearch - Mesin pencari & analitik terdistribusi
- Solr - Solr adalah platform pencarian multi-modal yang sangat cepat, open source, dibangun di atas vektor teks lengkap, dan kemampuan pencarian geospasial dari Apache Lucene
- Server Pencarian Perusahaan Fess
- Typesense - alternatif sumber terbuka untuk Algolia.
- SearchHub.io
- Datafari - solusi pencarian perusahaan open source.
- Qdrant - database vektor sumber terbuka.
- Awakari - Pencarian Real-Time dari sumber tak terbatas seperti RSS, Fediverse, Telegram. Kondisi pencocokan kata kunci teks, kondisi numerik, grup kondisi. Berbasis indeks pencarian terbalik.
- Meilisearch - API pencarian sumber terbuka yang mendukung pencarian teks lengkap, vektor, geospasial & segi
Perusahaan konsultan
- Butik BigData
- Koneksi Sumber Terbuka
- https://sease.io/
- teks semat
Studi kasus
- Airbnb - Peringkat Pencarian Pengalaman Airbnb yang Didukung Pembelajaran Mesin
- Airbnb - Mencantumkan Sematan di Peringkat Pencarian
- Algolia - Arsitektur Jaringan Pencarian Terdistribusi Algolia
- Meituan - Eksplorasi dan praktik BERT di peringkat inti pencarian Meituan (?? BERT在美团搜索核心排序的探索和实践)
- Netflix - Cara Rekayasa Konten Netflix membuat grafik gabungan dapat dicari (Bagian 1, Bagian 2)
- Netflix - Strategi Pengindeksan Elasticsearch di Platform Manajemen Aset (AMP)
- Skyscanner - Belajar Memberi Peringkat untuk Pencarian Rencana Perjalanan Penerbangan
- Slack - Cari di Slack
- Twitter - Stabilitas dan skalabilitas untuk pencarian
- Penjelasan SEO Amazon: Cara Memberi Peringkat Produk Anda #1 di Hasil Pencarian Amazon pada tahun 2020
- Membangun Mesin Pencari yang Lebih Baik untuk Semantic Scholar
Pencarian umum
- Bagaimana Bing Memberi Peringkat Hasil Pencarian: Algoritma Inti & Tautan Biru
- Cara Kerja Pemeringkatan Penelusuran Google – Darwinisme dalam Penelusuran
perdagangan elektronik
Pasar multisisi
- Temukan Cara Kerja dan Peringkat Cassini (Mesin Pencari eBay).
Video
Tip Singkat Apache Solr
Saluran
- Pikiran Jernih
- karya jernih
- Pencarian E-niaga MIx-Camp
- Koneksi Sumber Terbuka
- SIGIR eCom
Unggulan
Kumpulan data
- Kumpulan Data Kueri Belanja: Tolok Ukur ESCI Skala Besar untuk Meningkatkan Pencarian Produk
- ESCI-S: metadata yang diperluas untuk kumpulan data Amazon ESCI
- Relevansi Pencarian Produk Home Depot
- WANDS - Kumpulan Data Anotasi Wayfair
Peralatan
Spasi
Spacy Luar Biasa - Pemahaman bahasa alami, pengayaan konten, dll.
Kata2Vec
- Word2Vec Untuk Frasa - Mempelajari Embeddings Untuk Lebih dari Satu Kata
- Tutorial Gensim Word2Vec
- Cara memasukkan frasa ke dalam Word2Vec – pendekatan penambangan teks
- Word2Vec - langkah kecil dalam Pembelajaran Mendalam namun merupakan lompatan besar menuju Pemrosesan Bahasa Alami
- Cara Mengembangkan Penyematan Kata dengan Python dengan Gensim
lib
- Segmenter Kueri
- https://github.com/zentity-io/zentity
- https://github.com/mammothb/symspellpy
- https://github.com/searchhub/search-collector
- Kiri - Pencarian semantik canggih menjadi mudah.
- Haystack - Kerangka kerja Python ujung ke ujung untuk membangun antarmuka pencarian bahasa alami ke data.
- https://github.com/castorini/docTTTTTquery
Lainnya
- Paduan Suara, Smui, Querqy
- Aneh
- Evaluator Peringkat yang Dinilai
- Jina AI - Kerangka pencarian saraf
Hal luar biasa lainnya
- Grafik Pengetahuan yang Luar Biasa
- Rangkaian waktu yang mengagumkan
- Spacy yang luar biasa
- Pemahaman Kueri
- Klik model