การค้นหาที่ยอดเยี่ยม
สนับสนุนการต่อสู้เพื่ออิสรภาพของยูเครน
เรือรบรัสเซีย ไป F*CK ด้วยตัวคุณเอง
ฉันสร้างแอปพลิเคชันการค้นหาอีคอมเมิร์ซมาเกือบสิบปีแล้ว ด้านล่างนี้คุณจะพบรายชื่อสิ่งพิมพ์ การประชุม และหนังสือที่สร้างแรงบันดาลใจให้กับฉัน (บางส่วน) จัดกลุ่มตามหัวข้อ (หากบทความมีหลายหัวข้อ - จะแบ่งออกเป็นหลายหัวข้อ)
ติดดาวเราบน GitHub — มันช่วยได้!
ตรวจสอบคอลเลกชันอีคอมเมิร์ซที่ยอดเยี่ยมอื่น ๆ ของฉัน กราฟความรู้ที่ยอดเยี่ยม แอพคลาวด์ที่ยอดเยี่ยม
หัวข้อ
- ทั่วไป สนุกสนาน ปรัชญา
- ประเภทของการค้นหา
- การค้นหาแบบคลาสสิก/คำศัพท์
- เวกเตอร์/การค้นหาความหมาย
- การฝัง
- ประเภทของเวกเตอร์
- เวกเตอร์หนาแน่น
- เวกเตอร์กระจัดกระจาย
- โมเดลเอ็นโค้ดเดอร์
- สถาปัตยกรรมหลัก
- การโต้ตอบโทเค็นแบบสอบถาม / เอกสาร
- ไม่มีการโต้ตอบ - สองทาวเวอร์ / ไบเอ็นโค้ดเดอร์
- การโต้ตอบในช่วงแรก - ตัวเข้ารหัสข้าม
- การโต้ตอบล่าช้า - ColBERT
- การจัดการการฝังมิติสูง
- การลดขนาด
- การหาปริมาณ
- การหาปริมาณสเกลาร์
- การหาปริมาณไบนารี
- การค้นหาความหมายแบบสมมาตรและไม่สมมาตร
- การค้นหาแบบผสมผสาน
- ฟิวชั่นอันดับซึ่งกันและกัน - RRF
- การค้นหาหลายรูปแบบ
- พื้นที่ใช้งาน
- ค้นหาองค์กร
- ค้นหาอีคอมเมิร์ซ
- การค้นหาการสนทนา
- การค้นหาทางภูมิศาสตร์เชิงพื้นที่
- การค้นหาทางการแพทย์และการดูแลสุขภาพ
- โซเชียลมีเดียและการค้นหาเนื้อหาที่ผู้ใช้สร้างขึ้น
- ระบบตอบคำถาม
- การจัดการข้อมูลส่วนบุคคล
- ผลการค้นหา
- การเรียกคืน
- การจัดอันดับ
- การจัดอันดับหลายขั้นตอน
- การเรียนรู้ที่จะจัดอันดับ
- อคติ
- การกระจายความเสี่ยง
- การปรับเปลี่ยนในแบบของคุณ
- ผลการค้นหาเป็นศูนย์
- ค้นหา UX
- สถาบันเบย์มาร์ด
- นีลเส็น นอร์แมน กรุ๊ป
- ความรู้องค์กร LLC
- แง่มุม
- อื่น
- การแก้ไขการสะกด
- ข้อเสนอแนะ
- คำพ้องความหมาย
- คำหยุด
- กราฟ/อนุกรมวิธาน/กราฟความรู้
- บูรณาการการค้นหาและกราฟความรู้ (โดย Enterprise Knowledge)
- การขยายแบบสอบถาม
- สอบถามความเข้าใจ
- จุดประสงค์ในการค้นหา
- การแบ่งส่วนแบบสอบถาม
- อัลกอริทึม
- เบิร์ต
- โคลเบิร์ต
- การจัดระเบียบวลีทั่วไป
- อัลกอริทึมอื่นๆ
- การติดตาม การทำโปรไฟล์ GDPR การวิเคราะห์
- การทดลอง
- การประเมินการค้นหา
- รพ
- การทดสอบ ตัวชี้วัด KPI
- การประเมินการค้นหา (โดย Daniel Tunkelang)
- การวัดการค้นหา (โดย James Rubinstein)
- สามเสาหลักของความเกี่ยวข้องในการค้นหา (โดย Andreas Wagner)
- สถาปัตยกรรม
- ค้นหาเวกเตอร์
- การศึกษาและการสร้างเครือข่าย
- การประชุม
- การฝึกอบรมและหลักสูตรต่างๆ
- หนังสือ
- บล็อกและพอร์ทัล ข่าวสาร
- เอกสาร
- ผู้บริหารทีมค้นหา
- ผู้เล่นในอุตสาหกรรม
- บุคลิกภาพและผู้มีอิทธิพล
- เครื่องมือค้นหา
- สินค้าและบริการ
- บริษัทที่ปรึกษา
- บล็อกโพสต์ซีรีส์
- การเพิ่มประสิทธิภาพการค้นหา 101 (โดย Charlie Hull)
- ความเข้าใจในแบบสอบถาม (โดย Daniel Tunkelang)
- กริดไดนามิกส์
- พิจารณาการค้นหา: หัวข้อการค้นหา (โดย Derek Sisson)
- วิดีโอ
- กรณีศึกษา
- การค้นหาทั่วไป
- ตลาดหลายด้าน
- อีคอมเมิร์ซ
- ชุดข้อมูล
- เครื่องมือ
ไม่เรียงลำดับ
- แซนด์บ็อกซ์มิถุนายน 2021
- แซนด์บ็อกซ์พฤษภาคม 2021
- แซนด์บ็อกซ์เดือนเมษายน 2021
- แซนด์บ็อกซ์ธันวาคม 2020
- แซนด์บ็อกซ์ ม.ค. 2020
ทั่วไป สนุกสนาน ปรัชญา
- โปรแกรมเมอร์เรื่องเท็จเชื่อเรื่องการค้นหา
- การค้นหาอย่างมีจริยธรรม: การออกแบบการเดินทางที่ไม่อาจต้านทานได้พร้อมผลกระทบเชิงบวก
- ในการค้นหาความหมาย
- หนี้ความคิดเห็น: สิ่งที่เซกเวย์สอนทีมค้นหา
- สนับสนุนการเดินทางของผู้ค้นหา: เมื่อใดและอย่างไร
- การช็อปปิ้งเป็นเรื่องยาก ไปค้นหากันเถอะ!
- ข้อมูลเบื้องต้นเกี่ยวกับคุณภาพการค้นหา
- รูปแบบการออกแบบการค้นหาบนเว็บไซต์สำหรับอีคอมเมิร์ซ: โครงสร้างสคีมา การจัดอันดับที่ขับเคลื่อนด้วยข้อมูล และอื่นๆ
- ในการค้นหาการเรียกคืน
- ปรับสมดุลงบประมาณการค้นหาของคุณ!
ประเภทของการค้นหา
- วิวัฒนาการของเทคโนโลยีการค้นหา: มองไปข้างหน้า
การค้นหาแบบคลาสสิก/คำศัพท์
- เอทซี่. การกำหนดเป้าหมายคำค้นหาแบบกว้างๆ ในการค้นหา
- Etsy ใช้อุณหพลศาสตร์เพื่อช่วยคุณค้นหา "Geeky" อย่างไร
- คำค้นหาที่กว้างและคลุมเครือ
- การแยกโครงสร้างการค้นหาอีคอมเมิร์ซ: แบบสอบถาม 12 ประเภท
เวกเตอร์/การค้นหาความหมาย
การย้ายไปยัง Elasticsearch ด้วยเวกเตอร์หนาแน่นสำหรับเครื่องมือค้นหา Carousell Spotlight
โมเดลการฝังการค้นหาเชิงความหมายตั้งแต่ศูนย์ไปจนถึง
แนวทางการเลือกดัชนี
ไพน์โคนซีรีส์
- ดัชนีเพื่อนบ้านที่ใกล้ที่สุดสำหรับการค้นหาความคล้ายคลึงกัน
- WHERE Clause ที่หายไปในการค้นหาเวกเตอร์
สร้างสรรค์ประสบการณ์การค้นหาด้วย Amazon OpenSearch และ Amazon Bedrock
การค้นหาความหมายแบบสมมาตรและไม่สมมาตร
- การค้นหาความหมายแบบสมมาตรกับแบบอสมมาตร
การฝัง
ประเภท
- Bi-encoder กับ Cross encoder ควรใช้อันไหนเมื่อไร?
- ColBERT และการโต้ตอบล่าช้าคืออะไร และเหตุใดจึงมีความสำคัญในการค้นหา
โมเดลเอ็นโค้ดเดอร์
- การเลือกโมเดลที่ดีที่สุดสำหรับการค้นหาความหมาย
การโต้ตอบโทเค็นแบบสอบถาม / เอกสาร
ไม่มีการโต้ตอบ - สองทาวเวอร์ / ไบเอ็นโค้ดเดอร์
การโต้ตอบในช่วงแรก - ตัวเข้ารหัสข้าม
การโต้ตอบล่าช้า - ColBERT
- ประกาศเปิดตัวเครื่องฝัง Vespa ColBERT
- ColBERT และการโต้ตอบล่าช้าคืออะไร และเหตุใดจึงมีความสำคัญในการค้นหา
เวกเตอร์หนาแน่น
การฝัง Matryoshka
- การฝัง Matryoshka: การค้นหาเวกเตอร์ OpenAI ที่เร็วขึ้นโดยใช้ Adaptive Retrieval
- ข้อมูลเบื้องต้นเกี่ยวกับโมเดลการฝัง Matryoshka
- การเป็นตัวแทนของ Matryoshka คำแนะนำสำหรับการค้นหาความหมายที่รวดเร็วยิ่งขึ้น
เวกเตอร์กระจัดกระจาย
สแปลด
- การค้นหาแบบไฮบริด: SPLADE (ตัวเข้ารหัสแบบกระจาย)
- SPLADE สำหรับการค้นหาเวกเตอร์กระจัดกระจายอธิบาย
การจัดการการฝังมิติสูง
การลดขนาด
การหาปริมาณ
การฝังไบนารี
การค้นหาแบบผสมผสาน
- การค้นหาแบบไฮบริด > ผลรวมของส่วนต่างๆ หรือไม่
- ในการค้นหาแบบไฮบริด
- การค้นหาแบบไฮบริดพร้อมการจัดอันดับใหม่
ฟิวชั่นอันดับซึ่งกันและกัน (RRF)
- การค้นหาแบบไฮบริดพร้อมการจัดอันดับใหม่
- ฟิวชั่นอันดับซึ่งกันและกัน
การค้นหาหลายรูปแบบ
- Muves: การค้นหาเวกเตอร์หลายรูปแบบและหลายภาษาพร้อมการเร่งความเร็วด้วยฮาร์ดแวร์
- การเลือกแบบจำลองสำหรับการค้นหาต่อเนื่องหลายรูปแบบ
พื้นที่ใช้งาน
ค้นหาองค์กร
- GenAI สามารถปรับปรุงการค้นหาระดับองค์กรได้ แต่ยังคงอยู่ในระหว่างดำเนินการ
ค้นหาอีคอมเมิร์ซ
- อิทธิพลของอัลกอริธึม TF-IDF ในการค้นหาอีคอมเมิร์ซ
การค้นหาการสนทนา
- ค้นหาเป็นการสนทนา
- ค่าใช้จ่ายสำหรับการค้นหาการสนทนา
- แบบสอบถามความเข้าใจและ Chatbots
ผลการค้นหา
การเรียกคืน
ความเกี่ยวข้อง
- มนุษย์ค้นหาสิ่งต่าง ๆ ที่ไม่ใช่เชือก
- ผลการค้นหา 'ที่เกี่ยวข้อง' คืออะไร
- วิธีบรรลุความเกี่ยวข้องในการค้นหาอีคอมเมิร์ซ
- จัดทำโปรแกรมประเมินความเกี่ยวข้อง
อัลกอริธึมความเกี่ยวข้อง
- ทำความเข้าใจอัลกอริธึมการค้นหาข้อความแบบเต็ม BM25
- BM25 ที่ใช้งานได้จริง: วิธีที่ Shards ส่งผลต่อการให้คะแนนความเกี่ยวข้องใน Elasticsearch, อัลกอริทึม BM25 และตัวแปรของมันอย่างไร
- อิทธิพลของอัลกอริธึม TF-IDF ในการค้นหาอีคอมเมิร์ซ
- BM25 ความเกี่ยวข้องของ Lucene รุ่นต่อไป
- อธิบายความคล้ายคลึงกันของ Lucene (BM25, DFR, DFI, IB, LM)
การจัดอันดับ
การจัดอันดับแบบหลายขั้นตอน
การเรียนรู้ที่จะจัดอันดับ
- การค้นหาแตกต่างจากปัญหาการเรียนรู้ของเครื่องอื่นๆ อย่างไร
- การเรียนรู้เสริมแรงช่วยจัดอันดับการค้นหา
- การค้นหาอีคอมเมิร์ซได้รับการจัดอันดับใหม่เป็นปัญหาการเรียนรู้แบบเสริมกำลัง
- เมื่อใดควรใช้แมชชีนเลิร์นนิงกับอันดับการค้นหาตามคะแนน
- การเรียนรู้เพื่อจัดอันดับคืออะไร?
- การใช้ AI และการเรียนรู้ของเครื่องเพื่อเอาชนะอคติตำแหน่งภายใน Adobe Stock Search
- แยกชุดฝึกอบรมและการทดสอบเพื่อประเมินการเรียนรู้เพื่อจัดอันดับโมเดล
- วิธีการทำงานของ LambdaMART - ปรับเป้าหมายการจัดอันดับผลิตภัณฑ์ให้เหมาะสม
คลิกรุ่นเพื่อค้นหา
- คลิกรุ่น
- คลิกการสร้างแบบจำลองสำหรับอีคอมเมิร์ซ
- การใช้ข้อมูลพฤติกรรมเพื่อปรับปรุงการค้นหา
อคติ
- Presentation Bias ในการค้นหาคืออะไร
- การจัดการกับอคติตำแหน่งในคำแนะนำและการค้นหา
การกระจายความเสี่ยง
- ความหลากหลายของผลการค้นหาโดยใช้แบบจำลองภาษาเชิงสาเหตุ
- การเรียนรู้ที่จะกระจายความหลากหลายสำหรับการค้นหาอีคอมเมิร์ซด้วยโจรที่มีอาวุธหลากหลาย
- คุณภาพการค้นหาเพื่อการค้นพบและแรงบันดาลใจ
- วิธีวัดความหลากหลายของผลการค้นหา
- ตามหาโกลดิล็อคส์
- คำค้นหาที่กว้างและคลุมเครือ - รับรู้เมื่อผลการค้นหาต้องการความหลากหลาย
- ความคิดเกี่ยวกับความหลากหลายของผลการค้นหา
การปรับเปลี่ยนในแบบของคุณ
- รูปแบบสำหรับการปรับเปลี่ยนในแบบของคุณในคำแนะนำและการค้นหา
- การปรับแต่ง Daniel Tunkelang
- Airbnb - การปรับเปลี่ยนในแบบของคุณแบบเรียลไทม์ในการค้นหา
- 98 จุดข้อมูลส่วนบุคคลที่ Facebook ใช้เพื่อกำหนดเป้าหมายโฆษณาไปยังคุณ
- สถาปัตยกรรมของระบบการแนะนำในโลกแห่งความเป็นจริง
- วิศวกรรมคุณลักษณะสำหรับการค้นหาส่วนบุคคล
ผลการค้นหาเป็นศูนย์
- กลยุทธ์ในการใช้คำค้นหาทางเลือกเพื่อลดผลลัพธ์เป็นศูนย์และการประยุกต์ใช้ในตลาดออนไลน์
- ความเท่าเทียมกันทางความหมายของแบบสอบถามอีคอมเมิร์ซ
ค้นหา UX
สถาบันเบย์มาร์ด
- การแยกโครงสร้างการค้นหาอีคอมเมิร์ซ: แบบสอบถาม 12 ประเภท
- นำทางอัตโนมัติหรือแนะนำผู้ใช้ไปยังหมวดหมู่ที่ตรงกัน
- 13 รูปแบบการออกแบบสำหรับคำแนะนำในการเติมข้อความอัตโนมัติ (27% เข้าใจผิด)
- การค้นหาอีคอมเมิร์ซจำเป็นต้องสนับสนุนคำค้นหาที่ไม่ใช่ผลิตภัณฑ์ของผู้ใช้ (ไม่ 15%)
- ค้นหา UX: 6 องค์ประกอบสำคัญสำหรับหน้า 'ไม่มีผลลัพธ์'
- ภาพขนาดย่อของผลิตภัณฑ์ควรอัปเดตแบบไดนามิกเพื่อให้ตรงกับรูปแบบที่ค้นหา (54% ไม่)
- การเรียงลำดับแบบ Faceted - วิธีการใหม่ในการเรียงลำดับผลการค้นหา
- สถานะปัจจุบันของการค้นหาอีคอมเมิร์ซ
- ไซต์อีคอมเมิร์ซต้องการคุณสมบัติ 'ขอบเขตการค้นหา' 5 ประการเหล่านี้
- การออกแบบช่องค้นหาอีคอมเมิร์ซและผลกระทบ
- ไซต์อีคอมเมิร์ซควรมีตัวอย่างการค้นหาตามบริบท (96% เข้าใจผิด)
- การใช้งานการค้นหาอีคอมเมิร์ซ: รายงานและเกณฑ์มาตรฐาน
- การปรับปรุง UX อีคอมเมิร์ซที่เกี่ยวข้องกับ 'Covid-19' หกรายการที่ต้องทำ
นีลเส็น นอร์แมน กรุ๊ป
- รูปแบบการจ้องมองแบบรักแรกพบบนหน้าผลการค้นหา
- การละทิ้งที่ดีในหน้าผลการค้นหา
- หน้าผลลัพธ์การค้นหาที่ซับซ้อนเปลี่ยนพฤติกรรมการค้นหา: รูปแบบพินบอล
- คำแนะนำการค้นหาไซต์
- การวิเคราะห์บันทึกการค้นหา: โอกาสที่ถูกมองข้ามมากที่สุดในการวิจัย Web UX
- การค้นหาที่กำหนดขอบเขต: อันตราย แต่บางครั้งก็มีประโยชน์
- 3 แนวทางปฏิบัติสำหรับหน้า Search Engine "ไม่มีผลลัพธ์"
ความรู้องค์กร LLC
- การเพิ่มประสิทธิภาพประสบการณ์การค้นหาของคุณ: แนวทางการออกแบบการค้นหาที่คำนึงถึงมนุษย์เป็นศูนย์กลาง
แง่มุม
- แง่มุมของการค้นหาแบบ Faceted
- กาแฟ กาแฟ กาแฟ!
- การค้นหาแบบ Faceted (เริ่มที่นี่!)
- วิธีใช้การค้นหาแบบ Faceted อย่างถูกต้อง
- ข้อมูลเมตาและการค้นหาแบบ Faceted
- Metacrap: จุดคบเพลิงให้กับชายฟางเจ็ดคนแห่งเมตายูโทเปีย
- 7 การปรับใช้การกรองที่ทำให้ Macy ดีที่สุดในชั้นเรียน
- Facet Search: คู่มือที่ครอบคลุมที่สุด แนวทางปฏิบัติที่ดีที่สุด รูปแบบการออกแบบ คำเตือนที่ซ่อนอยู่ และวิธีแก้ปัญหา
- แง่มุม: ข้อ จำกัด หรือการตั้งค่า?
- แง่มุม แต่อันไหน?
นักอนุกรมวิธานอุบัติเหตุ
- อนุกรมวิธานควรมีกี่แง่มุม
- เมื่ออนุกรมวิธานไม่ควรเป็นแบบลำดับชั้น
- การปรับแต่งด้านอนุกรมวิธาน
อื่น
- การเรียนรู้จากแรงเสียดทานเพื่อปรับปรุงประสบการณ์การค้นหา
- ทำไมการเรียงลำดับราคาจึงยากนัก?
- การเรียงลำดับแบบเหลี่ยมเพชรพลอย
- Google ทำลายการค้นหาทันใจ
การแก้ไขการสะกด
- ปีเตอร์ นอร์วิก. "วิธีการเขียนตัวแก้ไขการสะกด" สิ่งพิมพ์คลาสสิก
- แดเนียล ตุงเคลัง. “การแก้ไขการสะกดคำ”
- เครื่องตรวจตัวสะกดอย่างง่ายที่สร้างจากเวกเตอร์คำ
- มองปัญหาการแก้ไขตัวสะกดให้ละเอียดยิ่งขึ้น: 1, 2, 3, ทำนาย
- การสะกดลึก
- การสร้างแบบจำลองการแก้ไขการสะกดคำสำหรับการค้นหาที่ Etsy
- วูล์ฟ การ์เบ. ผู้เขียน Sympell อัลกอริธึมการแก้ไขการสะกดคำเร็วขึ้น 1,000 เท่า ไฮไลท์ยอดนิยม SymSpell เทียบกับ BK-tree: การค้นหาสตริงแบบคลุมเครือเร็วขึ้น 100 เท่าและการตรวจสอบการสะกดคำ การแบ่งส่วนคำที่รวดเร็วของข้อความที่มีเสียงดัง
- Chars2vec: โมเดลภาษาที่ใช้อักขระสำหรับจัดการข้อความในโลกแห่งความเป็นจริงที่มีการสะกดผิดและ
- JamSpell การแก้ไขตัวสะกดโดยคำนึงถึงบริบทโดยรอบ - ห้องสมุด (ในภาษารัสเซีย) Исправляем опечатки с учётом контекста
- การฝังเพื่อแก้ไขตัวสะกด
- เครื่องตรวจตัวสะกดอย่างง่ายที่สร้างจากเวกเตอร์คำ
- อัลกอริธึมการแก้ไขตัวสะกดที่เครื่องมือค้นหาใช้มีอะไรบ้าง
- Moman - lucene/solr/elasticsearch การแก้ไขการสะกดคำ/การแก้ไขอัตโนมัติ (คือ?) ขับเคลื่อนโดยไลบรารีนี้จริง ๆ
- การแบ่งส่วนแบบสอบถามและการแก้ไขการสะกดคำ
- การใช้การตรวจสอบการสะกดแบบ Context Aware ใน Spark NLP
- แก้ไขอัตโนมัติใน Google, Amazon และ Pinterest และวิธีเขียนของคุณเอง
คำพ้องความหมาย
- เพิ่มพลังของ Elasticsearch ด้วยคำพ้องความหมาย
- พูดจริงเกี่ยวกับคำพ้องความหมายและการค้นหา
- คำพ้องความหมายใน Solr I — ความดี ความชั่ว และสิ่งที่น่าเกลียด
- คำพ้องและคำตรงข้ามจาก WordNet
- คำพ้องและคำตรงข้ามใน Python
- เจาะลึก WordNet ด้วย NLTK
- สร้างการค้นหาที่ดีขึ้นด้วยการตรวจจับคำพ้องอัตโนมัติ
- คำพ้องความหมายหลายคำในการค้นหาโดยใช้ Querqy
- วิธีการสร้างแบบจำลองคำพ้องความหมายอัจฉริยะ
- ความสำคัญของคำพ้องความหมายในการค้นหาอีคอมเมิร์ซ
คำหยุด
- คำค้นหาแบบคำหยุดทั้งหมดมีความสำคัญหรือไม่
ข้อเสนอแนะ
คำพ้องความหมาย: เติมข้อความอัตโนมัติ, ค้นหาขณะที่คุณพิมพ์, คำแนะนำ
- จิโอวานนี่ เฟอร์นันเดซ-คินเคด การบูตสแตรปปิ้งการแนะนำอัตโนมัติ, การสร้างคอร์ปัสการแนะนำอัตโนมัติ, ตอนที่ 1, การสร้างคอร์ปัสการแนะนำอัตโนมัติ, ตอนที่ 2, โครงสร้างข้อมูลการดึงข้อมูลอัตโนมัติและอัลกอริทึม, การจัดอันดับการแนะนำอัตโนมัติ
- เกี่ยวกับข้อเสนอแนะสองประเภท
- การปรับปรุงคำแนะนำการค้นหาสำหรับอีคอมเมิร์ซ
- แนวทางปฏิบัติที่ดีที่สุดในการค้นหาเติมข้อความอัตโนมัติเพื่อเพิ่ม Conversion
- เหตุใดเราจึงพัฒนาโมดูล searchhub smartSuggest และเหตุใดจึงอาจมีความสำคัญต่อคุณ
- Nielsen Norman Group: คำแนะนำในการค้นหาไซต์
- 13 รูปแบบการออกแบบสำหรับคำแนะนำในการเติมข้อความอัตโนมัติ
- เติมข้อความอัตโนมัติ
- เติมข้อความอัตโนมัติและประสบการณ์ผู้ใช้
- การใช้ LINKEDIN LIKE SEARCH ในขณะที่คุณพิมพ์ด้วย ELASTICSEARCH
- แนวทางปฏิบัติที่ดีที่สุดในการเติมข้อความอัตโนมัติอันชาญฉลาด: ปรับปรุงความเกี่ยวข้องในการค้นหาและยอดขาย
- OLX: การสร้าง Corpus สำหรับ AutoSuggest (ตอนที่ 1), การดึงข้อมูลและการจัดอันดับอัตโนมัติ (ตอนที่ 2)
- การเติมข้อความอัตโนมัติ คำแนะนำการค้นหาแบบสด และการแก้ไขอัตโนมัติ: รูปแบบการออกแบบแนวปฏิบัติที่ดีที่สุด
- กระจก กระจกเงา ฉันกำลังพิมพ์อะไรต่อไป? ทั้งหมดเกี่ยวกับคำแนะนำการค้นหา
- เราสร้างคำแนะนำอัตโนมัติที่รวดเร็วปานสายฟ้าสำหรับ otto.de ได้อย่างไร
กราฟ/อนุกรมวิธาน/กราฟความรู้
กราฟความรู้ที่ใช้ในอุตสาหกรรมค้าปลีก
กราฟความรู้กำลังได้รับความนิยมมากขึ้นในด้านเทคโนโลยี เราสำรวจวิธีที่สามารถนำมาใช้ในอุตสาหกรรมค้าปลีกเพื่อเพิ่มข้อมูล ขยายผลการค้นหา และเพิ่มมูลค่าให้กับบริษัทค้าปลีก
กราฟความรู้ที่ยอดเยี่ยม
บูรณาการการค้นหาและกราฟความรู้ (โดย Enterprise Knowledge)
- ส่วนที่ 1: การแสดงความสัมพันธ์
- การขยายคำค้นหาด้วยการฝังคำค้นหา
การขยายแบบสอบถาม
- พื้นฐานของการเขียนคิวรีใหม่ (ตอนที่ 1): ความรู้เบื้องต้นเกี่ยวกับการขยายคิวรี
สอบถามความเข้าใจ
- ความเข้าใจในแบบสอบถามของ Daniel Tunkelang
- แบบสอบถามความเข้าใจแบ่งออกเป็นสามส่วน
- ค้นหาสิ่งต่าง ๆ ที่ไม่ใช่สตริง
- ทำความเข้าใจกับคำค้นหา ส่วนที่ 1 ส่วนที่ 2 ส่วนที่ 3
- การค้นพบอาหารด้วย Uber Eats: การสร้างเครื่องมือทำความเข้าใจแบบสอบถาม
- AI สำหรับการทำความเข้าใจแบบสอบถาม
จุดประสงค์ในการค้นหา
- การแมปคำค้นหาเพื่อค้นหาจุดประสงค์
- ค้นหา: เจตนา ไม่ใช่สินค้าคงคลัง
การแบ่งส่วนแบบสอบถาม
- การแบ่งส่วนแบบสอบถามแบบไม่มีผู้ดูแลกระดาษโดยใช้บันทึกแบบสอบถามเท่านั้น
- บทความเกี่ยวกับการแบ่งส่วนแบบสอบถามเชิงความหมาย
อัลกอริทึม
เบิร์ต
- ทำความเข้าใจ BERT และความเกี่ยวข้องของการค้นหา
- Google กำลังปรับปรุงการค้นหาเว็บด้วย BERT - เราสามารถใช้มันสำหรับการค้นหาระดับองค์กรด้วยได้หรือไม่
โคลเบิร์ต
- โมเดลภาษา Transformer ที่ได้รับการฝึกอบรมล่วงหน้าสำหรับการค้นหา - ตอนที่ 3
การจัดระเบียบวลีทั่วไป
- ตรวจจับวลีทั่วไป – สำนวนหลายคำ / คำ n-grams – จากประโยคต่างๆ โดยอัตโนมัติ
- ประสิทธิผลที่ไม่สมเหตุสมผลของการจัดระเบียบ
อัลกอริทึมอื่นๆ
- หนึ่งการเข้ารหัสที่ร้อนแรง
- การเขียนเครื่องมือค้นหาข้อความแบบเต็มโดยใช้ตัวกรอง Bloom
การแฮช
- การแฮชที่ละเอียดอ่อนในท้องถิ่น
- Locality Sensitive Hashing (LSH): คู่มือเชิงปฏิบัติและภาพประกอบ
- มินฮาช
จัดเรียงตามคะแนนเฉลี่ย
- ดีกว่าค่าเฉลี่ย: จัดเรียงตามคะแนนที่ดีที่สุด
- วิธีที่จะไม่เรียงลำดับตามคะแนนเฉลี่ย
การสกัดคำหลัก
- การแยกคำหลักโดยใช้ RAKE
- เครื่องมือแยกคำหลักอีกตัวหนึ่ง (Yake)
- การสกัดคีย์เวิร์ดด้วย BERT
การติดตาม การทำโปรไฟล์ GDPR การวิเคราะห์
เครื่องมือ แพลตฟอร์ม ตัวช่วยในการติดตามการค้นหา
- ข้อมูลเชิงลึกเกี่ยวกับพฤติกรรมผู้ใช้ OpenSearch
- การติดตามการค้นหาไซต์ด้วย Google Analytics 4
- เครื่องกวาดหิมะ
- ค้นหา-colletor
- OpenTelemetry พร้อมส่วนเพิ่มเติมการค้นหา
- การวิเคราะห์แบบสอบถามพัลส์
- การติดตามว่าใครฮอตและใครไม่แสดงความท้าทายแบบอัลกอริทึม
ทรัพยากร
- การลบข้อมูลระบุตัวตน: การจัดการความเสี่ยงในการปกป้องข้อมูล (หลักปฏิบัติ)
- กรอบการตัดสินใจในการไม่เปิดเผยตัวตน
- 98 จุดข้อมูลส่วนบุคคลที่ Facebook ใช้เพื่อกำหนดเป้าหมายโฆษณาไปยังคุณ
- การวิเคราะห์โอกาสสำหรับการค้นหา
- ใบหน้าถูกเปิดเผยสำหรับผู้ค้นหา AOL หมายเลข 4417749
- ข้อมูลการค้นหา AOL รั่วไหล
- ข้อมูลส่วนบุคคล
การทดลอง
- ข้อผิดพลาดทั่วไปของการทดลองค้นหา
- การปรับปรุง Search @scale ด้วยการทดลองสืบค้นที่มีประสิทธิภาพ
การทดสอบ A/B, MAB
- การทดสอบ A/B สำหรับการค้นหานั้นแตกต่างออกไป
- การค้นหาการทดสอบ A/B: คิดเหมือนนักวิทยาศาสตร์
การทดสอบ ตัวชี้วัด KPI
เมตริก
- ส่วนลดกำไรสะสม
- รสชาติของ NDCG - ปรับให้เป็นมาตรฐานอะไร!?
- อันดับซึ่งกันและกันเฉลี่ย
- พี@เค
- ไขปริศนา nDCG และ ERR
- การเลือกเมตริกการประเมินความเกี่ยวข้องในการค้นหาของคุณ
- วิธีใช้คะแนนสะสมคุณภาพที่มีส่วนลดแบบปกติ (NDCG) ใน Quepid
- https://en.wikipedia.org/wiki/Precision_and_recall
- https://en.wikipedia.org/wiki/F1_score
- การแสดงภาพเมตริกการค้นหา
- การเลือกเมตริกการประเมินความเกี่ยวข้องในการค้นหาของคุณ
- คำนวณอันดับเฉลี่ยซึ่งกันและกัน (MRR) โดยใช้ Pandas
- ระบบผู้แนะนำ: เมตริกการเรียนรู้ของเครื่องและเมตริกธุรกิจ
KPI
- 5 วิธีที่ถูกต้องในการวัดประสิทธิภาพของการค้นหา
- KPI การค้นหาไซต์อีคอมเมิร์ซ ส่วนที่ 1 – ลูกค้า ส่วนที่ 2 – ผลิตภัณฑ์ ส่วนที่ 3 - การสอบถาม
- การเรียนรู้จากแรงเสียดทานเพื่อปรับปรุงประสบการณ์การค้นหา
- เบื้องหลังเวทมนตร์แห่งประสบการณ์การค้นหาที่ราบรื่น
- การวิเคราะห์ตัวชี้วัดความเกี่ยวข้องของการค้นหาออนไลน์ด้วย Elastic Stack
- วิธีรับข้อมูลเชิงลึกจากการวิเคราะห์การค้นหา
การประเมินการค้นหา (โดย Daniel Tunkelang)
- วัดมัน
- การวัดพฤติกรรมของผู้ค้นหา
- การใช้วิจารณญาณของมนุษย์
- เมื่อไม่มีอัตราการแปลง
การวัดการค้นหา (โดย James Rubinstein)
- แนวทางทางสถิติและมนุษย์เป็นศูนย์กลางในการปรับปรุงเครื่องมือค้นหา
- แนวทางของมนุษย์
- จัดทำโปรแกรมประเมินความเกี่ยวข้อง
- ตัวชี้วัดมีความสำคัญ
- การค้นหาการทดสอบ A/B: คิดเหมือนนักวิทยาศาสตร์
- Query Triage: อาวุธลับสำหรับความเกี่ยวข้องในการค้นหา
- รีวิวการเปิดตัว: รวบรวมทุกอย่างเข้าด้วยกัน...
สามเสาหลักของความเกี่ยวข้องในการค้นหา (โดย Andreas Wagner)
- ส่วนที่ 1: ความสามารถในการค้นหา
- ส่วนที่ 2: คุณภาพการค้นหาสำหรับการค้นพบและแรงบันดาลใจ
สถาปัตยกรรม
- ศิลปะแห่งนามธรรม – การเยี่ยมชมสถาปัตยกรรม Webshop อีกครั้ง
- Canva - ขั้นตอนการค้นหา
- ส่วนที่ 1 โครงร่างของความท้าทายที่ต้องเผชิญ
- ส่วนที่ 2 สถาปัตยกรรมการค้นหาใหม่
- สถาปัตยกรรมที่ขับเคลื่อนด้วยเหตุการณ์เพื่อการจัดทำดัชนีการค้นหาที่มีประสิทธิภาพ
การศึกษาและการสร้างเครือข่าย
การประชุม
- เปิดใช้งาน
- ศัพท์เฉพาะของกรุงเบอร์ลิน
- กองหญ้า
- ยืดหยุ่น{ON}
- ค้นหาอีคอมเมิร์ซ MIX-CAMP
- อีคอมเมิร์ซ SIGIR
การฝึกอบรมและหลักสูตรต่างๆ
การค้นหาที่ขับเคลื่อนด้วยการเรียนรู้ของเครื่อง Doug Turnbull ถัดไป: 24 มกราคม 2023
การเชื่อมต่อโอเพ่นซอร์ส
- Elasticsearch "คิดเหมือนวิศวกรที่เกี่ยวข้อง"
- Solr "คิดอย่างวิศวกรที่เกี่ยวข้อง"
- นอกเหนือจากความเกี่ยวข้องในการค้นหา: การทำความเข้าใจและการวัดคุณภาพของผลการค้นหา
- สวัสดี LTR
การฝึกของซี
พื้นฐานการค้นหา Daniel Tunkelang, Grant Ingersoll ถัดไป: 6 กุมภาพันธ์ 2023
ค้นหาด้วยการเรียนรู้ของเครื่อง Daniel Tunkelang, Grant Ingersoll ถัดไป: 27 กุมภาพันธ์ 2023
ค้นหาผู้จัดการผลิตภัณฑ์ Daniel Tunkelang ถัดไป: 3 เมษายน 2023
การฝึกอบรม Solr, Elasticsearch และ OpenSearch ของ Sematext
ฤดูใบไม้ร่วงปี 2023
https://dtunkelang.medium.com/upcoming-search-classes-this-fall-58f877fe00ad
หนังสือ
- การค้นหาที่ขับเคลื่อนด้วย AI
- การค้นหาที่เกี่ยวข้อง
- การเรียนรู้เชิงลึกสำหรับการค้นหา
- การโต้ตอบกับระบบการค้นหา
- การฝังตัวในการประมวลผลภาษาธรรมชาติ ทฤษฎีและความก้าวหน้าในการแสดงเวกเตอร์ของความหมาย
- ค้นหาอินเทอร์เฟซผู้ใช้
- รูปแบบการค้นหา
- การวิเคราะห์การค้นหาสำหรับไซต์ของคุณ: การสนทนากับลูกค้าของคุณ
- คลิกโมเดลสำหรับการค้นหาเว็บ
- อัลกอริทึมการเพิ่มประสิทธิภาพ
บล็อกและพอร์ทัล
เอกสาร
ผู้บริหารทีมค้นหา
- การค้นหาคือกีฬาประเภททีม
- ความคิดเกี่ยวกับการจัดการทีมค้นหา
- เกี่ยวกับความเป็นผู้นำการค้นหา
- การสร้างทีมการค้นหาที่มีประสิทธิภาพ: กุญแจสำคัญในการค้นหาที่ยอดเยี่ยมและความเกี่ยวข้อง
- Query Triage: อาวุธลับสำหรับความเกี่ยวข้องในการค้นหา
- รีวิวการเปิดตัว: รวบรวมทุกอย่างไว้ด้วยกัน
- บทบาทของเจ้าของผลิตภัณฑ์การค้นหา
- การจัดการผลิตภัณฑ์ค้นหา: บทบาทที่เข้าใจผิดมากที่สุดในการค้นหา?
- ค้นหาความเกี่ยวข้องสำหรับทีมที่มีพนักงานไม่เพียงพอ
การสัมภาษณ์งาน
- คำถามสัมภาษณ์สำหรับวิศวกรที่เกี่ยวข้องกับการค้นหา นักวิทยาศาสตร์ข้อมูล และผู้จัดการผลิตภัณฑ์
- การสัมภาษณ์วิทยาศาสตร์ข้อมูล: การจัดอันดับและการค้นหา
วิศวกรรม
บล็อกโพสต์ซีรีส์
การเพิ่มประสิทธิภาพการค้นหา 101 (โดย Charlie Hull)
- ฉันจะรู้ได้อย่างไรว่าการค้นหาของฉันใช้งานไม่ได้?
- การค้นหาของฉัน 'เสียหาย' หมายความว่าอย่างไร
- คุณจะแก้ไขการค้นหาที่เสียหายได้อย่างไร?
- ลดความเสี่ยงทางธุรกิจด้วยการเพิ่มประสิทธิภาพการค้นหา
ความเข้าใจในแบบสอบถาม (โดย Daniel Tunkelang)
ค้นหาได้ดีขึ้นผ่านการทำความเข้าใจข้อความค้นหา
- บทนำ
- การระบุภาษา
- การกรองอักขระ
- โทเค็น
- การแก้ไขการสะกด
- การกั้นและการแบ่งคำ
- การเขียนแบบสอบถามใหม่: ภาพรวม
- การขยายแบบสอบถาม
- แบบสอบถามการผ่อนคลาย
- การแบ่งส่วนแบบสอบถาม
- การกำหนดขอบเขตแบบสอบถาม
- การรับรู้เอนทิตี
- อนุกรมวิธานและภววิทยา
- เติมข้อความอัตโนมัติ
- เติมข้อความอัตโนมัติและประสบการณ์ผู้ใช้
- ความเข้าใจแบบสอบถามตามบริบท: ภาพรวม
- บริบทของเซสชัน
- ตำแหน่งเป็นบริบท
- ฤดูกาล
- การปรับเปลี่ยนในแบบของคุณ
- ค้นหาเป็นการสนทนา
- บทสนทนาชี้แจง
- ข้อเสนอแนะเกี่ยวกับความเกี่ยวข้อง
- ค้นหาแบบ Faceted
- การนำเสนอผลการค้นหา
- ตัวอย่างผลการค้นหา
- การจัดกลุ่มผลการค้นหา
- การตอบคำถาม
- แบบสอบถามความเข้าใจและการเชื่อมต่อด้วยเสียง
- แบบสอบถามความเข้าใจและ Chatbots
กริดไดนามิกส์
- ไม่ใช่เครื่องมือค้นหาของพ่อคุณ: ประวัติโดยย่อของการค้นหาร้านค้าปลีก
- การค้นหาเวกเตอร์เชิงความหมาย: ขอบเขตใหม่ในการค้นพบผลิตภัณฑ์
- ส่งเสริมการค้นพบผลิตภัณฑ์ด้วยการค้นหาเชิงความหมาย
- แบบสอบถามเชิงความหมายแยกวิเคราะห์พิมพ์เขียว
พิจารณาการค้นหา: หัวข้อการค้นหา (โดย Derek Sisson)
- บทนำ
- สมมติฐานเกี่ยวกับการค้นหา
- สมมติฐานเกี่ยวกับพฤติกรรมการค้นหาผู้ใช้
- ประเภทของการรวบรวมข้อมูล
- มุมมองเชิงโครงสร้างของการค้นหา
- ผู้ใช้และงานการดึงข้อมูล
- การทดสอบการค้นหา
- ลิงค์การค้นหาและข้อมูลอ้างอิงที่เป็นประโยชน์
ผู้เล่นในอุตสาหกรรม
บุคลิกภาพและผู้มีอิทธิพล
- Daniel Tunkelang (เขาคือเทพเจ้าแห่งการค้นหา)
- แม็กซ์ เออร์วิน
- ดั๊ก เทิร์นบูล
- สถาบันเบย์มาร์ด
เครื่องมือค้นหา
- Google
- ปิง
- ยานเดกซ์
- อเมซอน
- อีเบย์
สินค้าและบริการ
- อัลโกเลีย
- เวสป้า
- Elasticsearch - เครื่องมือค้นหาและการวิเคราะห์แบบกระจาย
- Solr - Solr เป็นแพลตฟอร์มการค้นหาแบบโอเพ่นซอร์สที่รวดเร็วอย่างเห็นได้ชัด สร้างขึ้นจากเวกเตอร์ข้อความแบบเต็ม และความสามารถในการค้นหาเชิงพื้นที่ของ Apache Lucene
- เซิร์ฟเวอร์การค้นหา Fess Enterprise
- Typesense - ทางเลือกโอเพ่นซอร์สสำหรับ Algolia
- SearchHub.io
- Datafari - โซลูชันการค้นหาระดับองค์กรแบบโอเพ่นซอร์ส
- Qdrant - ฐานข้อมูลเวกเตอร์โอเพ่นซอร์ส
- Awakari - ค้นหาแบบเรียลไทม์จากแหล่งไม่จำกัด เช่น RSS, Fediverse, Telegram เงื่อนไขการจับคู่คีย์เวิร์ด เงื่อนไขตัวเลข กลุ่มเงื่อนไข อิงดัชนีการค้นหาแบบย้อนกลับ
- Meilisearch - API การค้นหาแบบโอเพ่นซอร์สที่รองรับการค้นหาข้อความแบบเต็ม เวกเตอร์ ภูมิสารสนเทศ และการค้นหาแบบเหลี่ยมเพชรพลอย
บริษัทที่ปรึกษา
- บิ๊กดาต้า บูติก
- การเชื่อมต่อโอเพ่นซอร์ส
- https://sease.io/
- เซมาเท็กซ์
กรณีศึกษา
- Airbnb - การจัดอันดับการค้นหาที่ขับเคลื่อนด้วยการเรียนรู้ของเครื่องของประสบการณ์ Airbnb
- Airbnb - การฝังรายการในการจัดอันดับการค้นหา
- Algolia - สถาปัตยกรรมของเครือข่ายการค้นหาแบบกระจายของ Algolia
- Meituan - การสำรวจและการปฏิบัติของ BERT ในการจัดอันดับหลักของการค้นหา Meituan (?? BERT在美团搜索核heart排序的探索和实践)
- Netflix - วิธีที่ Netflix Content Engineering ทำให้สามารถค้นหากราฟรวมได้ (ตอนที่ 1 ตอนที่ 2)
- Netflix - กลยุทธ์การจัดทำดัชนี Elasticsearch ในแพลตฟอร์มการจัดการสินทรัพย์ (AMP)
- Skyscanner - การเรียนรู้ที่จะจัดอันดับสำหรับการค้นหาแผนการเดินทางเที่ยวบิน
- Slack - ค้นหาที่ Slack
- Twitter - ความเสถียรและความสามารถในการปรับขนาดสำหรับการค้นหา
- อธิบาย Amazon SEO: วิธีจัดอันดับผลิตภัณฑ์ของคุณเป็นอันดับ 1 ในผลการค้นหาของ Amazon ในปี 2020
- การสร้างเครื่องมือค้นหาที่ดีขึ้นสำหรับ Semantic Scholar
การค้นหาทั่วไป
- Bing จัดอันดับผลการค้นหาอย่างไร: อัลกอริทึมหลักและลิงก์สีน้ำเงิน
- การจัดอันดับการค้นหาของ Google ทำงานอย่างไร - ลัทธิดาร์วินในการค้นหา
อีคอมเมิร์ซ
ตลาดหลายด้าน
- ค้นพบว่า Cassini (เครื่องมือค้นหาของ eBay) ทำงานและจัดอันดับอย่างไร
วิดีโอ
เคล็ดลับสั้น ๆ ของ Apache Solr
ช่อง
- ความคิดสุวิมล
- สุวิมลเวิร์คส์
- การค้นหาอีคอมเมิร์ซ MIx-Camp
- การเชื่อมต่อโอเพ่นซอร์ส
- SIGIR อิเล็กทรอนิกส์
โดดเด่น
ชุดข้อมูล
- ชุดข้อมูลคำค้นหาช็อปปิ้ง: เกณฑ์มาตรฐาน ESCI ขนาดใหญ่สำหรับการปรับปรุงการค้นหาผลิตภัณฑ์
- ESCI-S: เมตาดาต้าเพิ่มเติมสำหรับชุดข้อมูล Amazon ESCI
- ความเกี่ยวข้องในการค้นหาผลิตภัณฑ์ของโฮมดีโป
- WANDS - ชุดข้อมูลคำอธิบายประกอบ Wayfair
เครื่องมือ
สเปซี่
Awesome Spacy - ความเข้าใจภาษาที่เป็นธรรมชาติ การเพิ่มเนื้อหา ฯลฯ
Word2Vec
- Word2Vec สำหรับวลี — การเรียนรู้การฝังมากกว่าหนึ่งคำ
- บทช่วยสอน Gensim Word2Vec
- วิธีรวมวลีเข้ากับ Word2Vec – วิธีการขุดข้อความ
- Word2Vec — ก้าวแรกในการเรียนรู้เชิงลึก แต่เป็นก้าวกระโดดครั้งใหญ่สู่การประมวลผลภาษาธรรมชาติ
- วิธีการพัฒนาการฝังคำใน Python ด้วย Gensim
ลิบส์
- แบบสอบถามเซ็กเมนต์
- https://github.com/zentity-io/zentity
- https://github.com/mammothb/symspellpy
- https://github.com/searchhub/search-collector
- Kiri - การค้นหาความหมายที่ล้ำสมัยทำได้ง่าย
- Haystack - เฟรมเวิร์ก Python แบบ end-to-end สำหรับการสร้างอินเทอร์เฟซการค้นหาด้วยภาษาธรรมชาติกับข้อมูล
- https://github.com/castorini/docTTTTTquery
อื่น
- คอรัส, สมุย, เกร์กี
- งง
- ผู้ประเมินการจัดอันดับจัดอันดับ
- Jina AI - กรอบการค้นหาประสาท
สิ่งที่ยอดเยี่ยมอื่น ๆ
- กราฟความรู้ที่ยอดเยี่ยม
- ซีรีย์เวลาที่ยอดเยี่ยม
- สเปซี่สุดยอดครับ
- แบบสอบถามความเข้าใจ
- คลิกรุ่น