Tolle Suche
Unterstützen Sie den ukrainischen Freiheitskampf
RUSSISCHES KRIEGSSCHIFF, F*CK DICH
Ich entwickle seit fast zehn Jahren E-Commerce-Suchanwendungen. Nachfolgend finden Sie eine Liste (einiger) Veröffentlichungen, Konferenzen und Bücher, die mich inspirieren. Nach Themen gruppiert (Wenn ein Artikel in mehrere Themen passt, wird er in mehrere Abschnitte unterteilt).
Markieren Sie uns auf GitHub – es hilft!
Schauen Sie sich auch meine anderen Sammlungen an: Toller E-Commerce, tolle Wissensdiagramme und tolle Cloud-Apps
Themen
- Allgemeines, Spaß, Philosophie
- Arten der Suche
- Klassische/lexikalische Suche
- Vektoren/Semantische Suche
- Einbettungen
- Arten von Vektoren
- Dichte Vektoren
- Spärliche Vektoren
- Encoder-Modelle
- Hauptarchitekturen
- Interaktion zwischen Abfrage- und Dokumenttokens
- Keine Interaktionen – Zwei Türme / Bi-Encoder
- Frühe Interaktionen – Cross-Encoder
- Späte Interaktionen – ColBERT
- Umgang mit hochdimensionalen Einbettungen
- Dimensionsreduktion
- Quantisierung
- Skalare Quantisierung
- Binäre Quantisierung
- Symmetrische und asymmetrische semantische Suche
- Hybridsuche
- Reziproke Rangfusion – RRF
- Multimodale Suche
- Anwendungsgebiete
- Unternehmenssuche
- E-Commerce-Suche
- Konversationssuche
- Geo-räumliche Suche
- Suche nach Medizin und Gesundheitswesen
- Suche in sozialen Medien und benutzergenerierten Inhalten
- Frage-Antwort-Systeme
- Persönliches Informationsmanagement
- Suchergebnisse
- Abruf
- Rang
- Mehrstufiges Ranking
- Ranking lernen
- Klicken Sie auf „Modelle“, um zu suchen
- Voreingenommenheit
- Diversifizierung
- Personalisierung
- Keine Suchergebnisse
- Suchen Sie nach UX
- Baymard-Institut
- Nielsen Norman Group
- Enterprise Knowledge LLC
- Facetten
- Andere
- Rechtschreibkorrektur
- Vorschläge
- Synonyme
- Stoppwörter
- Diagramme/Taxonomien/Wissensdiagramm
- Integration von Such- und Wissensgraphen (von Enterprise Knowledge)
- Abfrageerweiterung
- Abfrageverständnis
- Suchabsicht
- Abfragesegmentierung
- Algorithmen
- BERT
- ColBERT
- Kollokationen, gebräuchliche Phrasen
- Andere Algorithmen
- Tracking, Profiling, DSGVO, Analyse
- Experimente
- Suche auswerten
- MRR
- Tests, Metriken, KPIs
- Bewertung der Suche (von Daniel Tunkelang)
- Messende Suche (von James Rubinstein)
- Drei Säulen der Suchrelevanz (von Andreas Wagner)
- Architektur
- Vektorsuche
- Bildung und Vernetzung
- Konferenzen
- Schulungen und Kurse
- Bücher
- Blogs und Portale, Nachrichten
- Papiere
- Management, Suchteam
- Vorstellungsgespräche
- Maschinenbau
- Branchenakteure
- Persönlichkeiten und Influencer
- Suchmaschinen
- Produkte und Dienstleistungen
- Beratungsunternehmen
- Blogpost-Reihe
- Suchoptimierung 101 (von Charlie Hull)
- Abfrageverständnis (von Daniel Tunkelang)
- Gitterdynamik
- Überlegungen zur Suche: Suchthemen (von Derek Sisson)
- Videos
- Fallstudien
- Allgemeine Suche
- Vielseitige Märkte
- E-Commerce
- Datensätze
- Werkzeuge
Unsortiert
- Sandbox Juni 2021
- Sandbox Mai 2021
- Sandbox April 2021
- Sandbox Dezember 2020
- Sandbox Januar 2020
Allgemeines, Spaß, Philosophie
- Unwahrheiten, die Programmierer über die Suche glauben
- Ethische Suche: Eine unwiderstehliche Reise mit positiven Auswirkungen gestalten
- Zur semantischen Suche
- Feedback-Schulden: Was der Segway Suchteams lehrt
- Die Reise des Suchers unterstützen: Wann und wie
- Einkaufen ist schwer, gehen wir auf die Suche!
- Eine Einführung in die Suchqualität
- On-Site-Suchdesignmuster für E-Commerce: Schemastruktur, datengesteuertes Ranking und mehr
- Auf der Suche nach Erinnerung
- Gleichen Sie Ihr Suchbudget aus!
Arten der Suche
- Entwicklung der Suchtechnologie: Ein Blick in die Zukunft
Klassische/lexikalische Suche
- Etsy. Ausrichtung auf umfassende Suchanfragen in der Suche
- Wie Etsy Thermodynamik nutzt, um Ihnen bei der Suche nach „Geeky“ zu helfen
- Umfangreiche und mehrdeutige Suchanfragen
- Dekonstruktion der E-Commerce-Suche: Die 12 Abfragetypen
Vektoren/Semantische Suche
Migration zu Elasticsearch mit dichtem Vektor für die Carousell Spotlight-Suchmaschine
Von Null zum Einbettungsmodell für die semantische Suche
Richtlinien zur Auswahl eines Index
Tannenzapfen-Serie
- Nächste-Nachbarn-Indizes für die Ähnlichkeitssuche
- Die fehlende WHERE-Klausel in der Vektorsuche
Innovatives Sucherlebnis mit Amazon OpenSearch und Amazon Bedrock
Symmetrische und asymmetrische semantische Suche
- Symmetrische vs. asymmetrische semantische Suche
Einbettungen
Typen
- Bi-Encoder vs. Cross-Encoder? Wann sollte welcher verwendet werden?
- Was ist ColBERT und Late Interaction und warum sind sie bei der Suche wichtig?
Encoder-Modelle
- Auswahl des besten Modells für die semantische Suche
Interaktion zwischen Abfrage- und Dokumenttokens
Keine Interaktionen – Zwei Türme / Bi-Encoder
Frühe Interaktionen – Cross-Encoder
Späte Interaktionen – ColBERT
- Ankündigung des Vespa ColBERT Embedders
- Was ist ColBERT und Late Interaction und warum sind sie bei der Suche wichtig?
Dichte Vektoren
Matroschka-Einbettungen
- Matroschka-Einbettungen: Schnellere OpenAI-Vektorsuche mit Adaptive Retrieval
- Einführung in Matroschka-Einbettungsmodelle
- Matroschka-Darstellungen. Ein Leitfaden für eine schnellere semantische Suche
Spärliche Vektoren
SPLADE
- Hybridsuche: SPLADE (Sparse Encoder)
- SPLADE für Sparse Vector Search erklärt
Umgang mit hochdimensionalen Einbettungen
Dimensionsreduktion
Quantisierung
Binäre Einbettungen
Hybridsuche
- Hybridsuche > Summe seiner Teile?
- Zur Hybridsuche
- Hybridsuche mit Re-Ranking
Reziproke Rangfusion (RRF)
- Hybridsuche mit Re-Ranking
- Reziproke Rangverschmelzung
Multimodale Suche
- Muves: Multimodale und mehrsprachige Vektorsuche mit Hardwarebeschleunigung
- Modellauswahl für die multimodale Suche
Anwendungsgebiete
Unternehmenssuche
- GenAI kann die Unternehmenssuche verbessern, ist aber noch in Arbeit
E-Commerce-Suche
- Der Einfluss von TF-IDF-Algorithmen auf die E-Commerce-Suche
Konversationssuche
- Suche als Konversation
- Möglichkeiten der Konversationssuche
- Abfrageverständnis und Chatbots
Suchergebnisse
Abruf
Relevanz
- Menschen suchen nach Dingen, nicht nach Schnüren
- Was ist ein „relevantes“ Suchergebnis?
- So erreichen Sie E-Commerce-Suchrelevanz
- Einrichten eines Relevanzbewertungsprogramms
Relevanzalgorithmen
- Den BM25-Volltextsuchalgorithmus verstehen
- Praktisches BM25: Wie sich Shards auf die Relevanzbewertung in Elasticsearch auswirken, der BM25-Algorithmus und seine Variablen
- Der Einfluss von TF-IDF-Algorithmen auf die E-Commerce-Suche
- BM25 Die nächste Generation von Lucene-Relevanz
- Lucene-Ähnlichkeiten (BM25, DFR, DFI, IB, LM) erklärt
Rang
Mehrstufiges Ranking
Ranking lernen
- Wie unterscheidet sich die Suche von anderen Problemen des maschinellen Lernens?
- Durch Verstärkungslernen unterstütztes Suchranking
- Reranking der E-Commerce-Suche als Problem des verstärkenden Lernens
- Wann sollte ein maschinell erlernter oder ein bewertungsbasierter Suchranker verwendet werden?
- Was ist „Ranking lernen“?
- Einsatz von KI und maschinellem Lernen zur Überwindung von Positionsverzerrungen in Adobe Stock Search
- Geteilte Trainings- und Testsätze zur Bewertung des Lernens, Modelle zu bewerten
- Wie LambdaMART funktioniert – Produkt-Ranking-Ziele optimieren
Klicken Sie auf „Modelle“, um zu suchen
- Klicken Sie auf Modelle
- Klicken Sie auf Modellierung für E-Commerce
- Verwendung von Verhaltensdaten zur Verbesserung der Suche
Voreingenommenheit
- Was ist Presentation Bias bei der Suche?
- Umgang mit Positionsverzerrungen bei Empfehlungen und Suche
Diversifizierung
- Diversifizierung der Suchergebnisse mithilfe kausaler Sprachmodelle
- Mit Multi-Armed Bandit lernen Sie, die E-Commerce-Suche zu diversifizieren
- Suchqualität für Entdeckung und Inspiration
- So messen Sie die Vielfalt der Suchergebnisse
- Auf der Suche nach Goldlöckchen
- Umfangreiche und mehrdeutige Suchanfragen – Erkennen, wann Suchergebnisse diversifiziert werden müssen
- Gedanken zur Vielfalt der Suchergebnisse
Personalisierung
- Muster zur Personalisierung in Empfehlungen und Suche
- Daniel Tunkelang Personalisierung
- Airbnb – Echtzeit-Personalisierung in der Suche
- 98 persönliche Datenpunkte, die Facebook verwendet, um gezielt Werbung auf Sie auszurichten
- Architektur realer Empfehlungssysteme
- Feature Engineering für personalisierte Suche
Keine Suchergebnisse
- Strategien zur Verwendung alternativer Abfragen zur Reduzierung von Nullergebnissen und deren Anwendung auf Online-Marktplätze
- Semantische Äquivalenz von E-Commerce-Anfragen
Suchen Sie nach UX
Baymard-Institut
- Dekonstruktion der E-Commerce-Suche: Die 12 Abfragetypen
- Automatische Weiterleitung oder Führung von Benutzern zur passenden Kategorie
- 13 Designmuster für Vorschläge zur automatischen Vervollständigung (27 % liegen falsch)
- Die E-Commerce-Suche muss die nicht produktbezogenen Suchanfragen der Benutzer unterstützen (15 % tun dies nicht)
- Search UX: 6 wesentliche Elemente für „Keine Ergebnisse“-Seiten
- Produktminiaturansichten sollten dynamisch aktualisiert werden, um der gesuchten Variante zu entsprechen (54 % tun dies nicht)
- Facettierte Sortierung – eine neue Methode zum Sortieren von Suchergebnissen
- Der aktuelle Stand der E-Commerce-Suche
- E-Commerce-Sites benötigen mehrere dieser 5 „Suchumfang“-Funktionen
- E-Commerce-Suchfelddesign und seine Auswirkungen
- E-Commerce-Websites sollten kontextbezogene Suchausschnitte enthalten (96 % liegen falsch)
- Benutzerfreundlichkeit der E-Commerce-Suche: Bericht und Benchmark
- Sechs „COVID-19“-bezogene E-Commerce-UX-Verbesserungen, die vorgenommen werden müssen
Nielsen Norman Group
- Das Blickmuster „Liebe auf den ersten Blick“ auf Suchergebnisseiten
- Guter Abbruch auf Suchergebnisseiten
- Komplexe Suchergebnisseiten ändern das Suchverhalten: Das Pinball-Muster
- Vorschläge für die Site-Suche
- Suchprotokollanalyse: Die am meisten übersehene Chance in der Web-UX-Forschung
- Bereichsbezogene Suche: Gefährlich, aber manchmal nützlich
- 3 Richtlinien für Suchmaschinen-„Keine Ergebnisse“-Seiten
Enterprise Knowledge LLC
- Optimieren Sie Ihr Sucherlebnis: Ein menschenzentrierter Ansatz für das Suchdesign
Facetten
- Facetten der Facettensuche
- Kaffee, Kaffee, Kaffee!
- Facettensuche (hier beginnen!)
- So implementieren Sie die Facettensuche richtig
- Metadaten und Facettensuche
- Metacrap: Die Fackel an sieben Strohmänner der Meta-Utopie richten
- 7 Filterimplementierungen, die Macy's zum Klassenbesten machen
- Facettensuche: Der umfassendste Leitfaden. Best Practices, Entwurfsmuster, versteckte Einschränkungen und Problemumgehungen
- Facetten: Einschränkungen oder Präferenzen?
- Facetten, aber welche?
Zufälliger Taxonom
- Wie viele Facetten sollte eine Taxonomie haben?
- Wenn eine Taxonomie nicht hierarchisch sein sollte
- Anpassen von Taxonomie-Facetten
Andere
- Aus Reibung lernen, um das Sucherlebnis zu verbessern
- Warum ist es so schwierig, nach Preis zu sortieren?
- Facettierte Sortierung
- Google tötet die Sofortsuche
Rechtschreibkorrektur
- Peter Norvig. „Wie schreibe ich einen Rechtschreibkorrektor“ . Klassische Veröffentlichung.
- Daniel Tunkelang. „Rechtschreibkorrektur“
- Eine einfache Rechtschreibprüfung, die aus Wortvektoren erstellt wurde
- Ein genauerer Blick auf das Rechtschreibkorrekturproblem: 1, 2, 3, preDict
- Tiefe Rechtschreibung
- Modellierung der Rechtschreibkorrektur für die Suche bei Etsy
- Wolf Garbe. Autor von Sympell. 1000x schnellerer Rechtschreibkorrekturalgorithmus, Top-Highlight SymSpell vs. BK-tree: 100x schnellere Fuzzy-String-Suche und Rechtschreibprüfung, schnelle Wortsegmentierung von verrauschtem Text
- Chars2vec: zeichenbasiertes Sprachmodell für den Umgang mit Texten aus der realen Welt mit Rechtschreibfehlern und
- JamSpell, Rechtschreibkorrektur unter Berücksichtigung des umgebenden Kontexts – Bibliothek, (auf Russisch) Исправляем опечатки с учётом контекста
- Einbettung zur Rechtschreibkorrektur
- Eine einfache Rechtschreibprüfung, die aus Wortvektoren erstellt wurde
- Welche Algorithmen zur Rechtschreibkorrektur werden von Suchmaschinen verwendet?
- Moman - Lucene/Solr/Elasticsearch-Rechtschreibkorrektur/Autokorrektur wird (wurde?) tatsächlich von dieser Bibliothek unterstützt.
- Abfragesegmentierung und Rechtschreibkorrektur
- Anwenden der kontextsensitiven Rechtschreibprüfung in Spark NLP
- Autokorrektur bei Google, Amazon und Pinterest und wie Sie Ihre eigene Autokorrektur schreiben
Synonyme
- Steigern Sie die Leistungsfähigkeit von Elasticsearch mit Synonymen
- Echtes Gespräch über Synonyme und Suche
- Synonyme in Solr I – Das Gute, das Schlechte und das Hässliche
- Synonyme und Antonyme aus WordNet
- Synonyme und Antonyme in Python
- Tauchen Sie mit NLTK in WordNet ein
- Erstellen Sie bessere Suchen durch automatische Synonymerkennung
- Mehrwortsynonyme bei der Suche mit Querqy
- So erstellen Sie ein intelligentes Synonymmodell
- Die Bedeutung von Synonymen in der E-Commerce-Suche
Stoppwörter
- Sind reine Stoppwort-Abfragen wichtig?
Vorschläge
Synonyme: automatische Vervollständigung, Suche während der Eingabe, Vorschläge
- Giovanni Fernandez-Kincade. Bootstrapping von Autosuggest, Aufbau eines Autosuggest-Korpus, Teil 1, Aufbau eines Autosuggest-Korpus, Teil 2, Autosuggest-Abrufdatenstrukturen und -algorithmen, Autosuggest-Ranking
- Auf zwei Arten von Vorschlägen
- Verbesserung der Suchvorschläge für den E-Commerce
- Best Practices für die automatische Vervollständigung der Suche zur Steigerung der Conversions
- Warum wir das Searchhub-SmartSuggest-Modul entwickelt haben und warum es für Sie wichtig sein könnte
- Nielsen Norman Group: Vorschläge für die Site-Suche
- 13 Entwurfsmuster für Vorschläge zur automatischen Vervollständigung
- Automatische Vervollständigung
- Autovervollständigung und Benutzererfahrung
- IMPLEMENTIEREN EINER LINKEDIN-ÄHNLICHEN SUCHE WÄHREND DER EINGABE MIT ELASTICSEARCH
- Intelligente Best Practices für die automatische Vervollständigung: Verbessern Sie die Suchrelevanz und den Umsatz
- OLX: Aufbau eines Korpus für AutoSuggest (Teil 1), AutoSuggest Retrieval & Ranking (Teil 2)
- Autovervollständigung, Live-Suchvorschläge und Autokorrektur: Best-Practice-Entwurfsmuster
- Spieglein, Spieglein, was tippe ich als nächstes? Alles über Suchvorschläge
- Wie wir den blitzschnellen Autosuggest für otto.de entwickelt haben
Diagramme/Taxonomien/Wissensdiagramm
Wissensgraphen werden im Einzelhandel angewendet
Wissensgraphen erfreuen sich in der Technik immer größerer Beliebtheit. Wir untersuchen, wie sie in der Einzelhandelsbranche eingesetzt werden können, um Daten anzureichern, Suchergebnisse zu erweitern und einen Mehrwert für ein Einzelhandelsunternehmen zu schaffen.
Tolle Wissensgraphen
Integration von Such- und Wissensgraphen (von Enterprise Knowledge)
- Teil 1: Beziehungen anzeigen
- Suchanfragenerweiterung mit Suchanfrageeinbettungen
Abfrageerweiterung
- Grundlagen des Abfrageumschreibens (Teil 1): Einführung in die Abfrageerweiterung
Abfrageverständnis
- Daniel Tunkelang Abfrageverständnis.
- Abfrageverständnis, unterteilt in drei Teile
- Suchen Sie nach Dingen, nicht nach Zeichenfolgen
- Die Suchabfrage verstehen. Teil 1, Teil 2, Teil 3
- Food Discovery mit Uber Eats: Aufbau einer Query Understanding Engine
- KI für das Verständnis von Abfragen
Suchabsicht
- Zuordnen von Suchanfragen zu Suchabsichten
- Suche: Absicht, nicht Inventar
Abfragesegmentierung
- Unüberwachte Abfragesegmentierung in Papierform, die nur Abfrageprotokolle verwendet
- Papier zur semantischen Abfragesegmentierung
Algorithmen
BERT
- BERT und Suchrelevanz verstehen
- Google verbessert die Websuche mit BERT – können wir es auch für die Unternehmenssuche nutzen?
ColBERT
- Vorab trainierte Transformer-Sprachmodelle für die Suche – Teil 3
Kollokationen, gebräuchliche Phrasen
- Erkennen Sie automatisch gebräuchliche Phrasen – Ausdrücke mit mehreren Wörtern / Wort-N-Gramm – aus einem Satzstrom.
- Die unangemessene Wirksamkeit von Kollokationen
Andere Algorithmen
- Eine heiße Kodierung
- Schreiben einer Volltextsuchmaschine mit Bloom-Filtern
Hashing
- Lokalitätssensitives Hashing
- Locality Sensitive Hashing (LSH): Der praktische und illustrierte Leitfaden
- Minhasch
Sortierung nach Durchschnittsbewertungen
- Besser als der Durchschnitt: Sortieren nach bester Bewertung
- So sortieren Sie nicht nach Durchschnittsbewertung
Extraktion von Schlüsselwörtern
- Schlüsselwortextraktion mit RAKE
- Noch ein weiterer Keyword-Extraktor (Yake)
- Schlüsselwortextraktion mit BERT
Tracking, Profiling, DSGVO, Analyse
Tools, Plattformen, Helfer zur Suchverfolgung
- Einblicke in das Benutzerverhalten von OpenSearch
- Site Search-Tracking mit Google Analytics 4
- Schneepflug
- Suchsammler
- OpenTelemetry mit Suchergänzungen
- Pulse Query Analytics
- Zu verfolgen, wer angesagt ist und wer nicht, stellt eine algorithmische Herausforderung dar
Ressourcen
- Anonymisierung: Umgang mit Datenschutzrisiken (Verhaltenskodex)
- Der Anonymisierungs-Entscheidungsrahmen
- 98 persönliche Datenpunkte, die Facebook verwendet, um gezielt Werbung auf Sie auszurichten
- Chancenanalyse für die Suche
- Ein Gesicht wird für AOL Searcher Nr. 4417749 entlarvt
- AOL-Suchdatenleck
- Persönliche Daten
Experimente
- Häufige Fallstricke beim Experimentieren mit der Suche
- Verbesserung der Suche @scale durch effiziente Abfrageexperimente
A/B-Tests, MABs
- A/B-Tests für die Suche sind anders
- A/B-Testing-Suche: Denken wie ein Wissenschaftler
Tests, Metriken, KPIs
Metriken
- Abgezinster kumulativer Gewinn
- Aromen von NDCG – normalisiert auf was!?
- Mittlerer reziproker Rang
- P@k
- Entmystifizierung von nDCG und ERR
- Auswahl Ihrer Suchrelevanz-Bewertungsmetrik
- So implementieren Sie einen NDCG-Ranking-Qualitätsscore (Normalized Discounted Cumulative Gain) in Quepid
- https://en.wikipedia.org/wiki/Precision_and_recall
- https://en.wikipedia.org/wiki/F1_score
- Suchmetriken visualisieren
- Auswahl Ihrer Suchrelevanz-Bewertungsmetrik
- Berechnen Sie den mittleren reziproken Rang (MRR) mithilfe von Pandas
- Empfehlungssysteme: Metriken für maschinelles Lernen und Geschäftsmetriken
KPIs
- 5 richtige Methoden zur Messung der Suchleistung
- E-Commerce-Site-Search-KPIs. Teil 1 – Kunden, Teil 2 – Produkte, Teil 3 – Anfragen
- Aus Reibung lernen, um das Sucherlebnis zu verbessern
- Hinter der Zauberei eines nahtlosen Sucherlebnisses
- Analyse von Online-Suchrelevanzmetriken mit dem Elastic Stack
- So gewinnen Sie Erkenntnisse aus Suchanalysen
Bewertung der Suche (von Daniel Tunkelang)
- Messen Sie es
- Messung des Suchverhaltens
- Menschliches Urteilsvermögen nutzen
- Wenn es keine Conversion-Rate gibt
Messende Suche (von James Rubinstein)
- Statistische und menschenzentrierte Ansätze zur Suchmaschinenverbesserung
- Ein menschlicher Ansatz
- Einrichten eines Relevanzbewertungsprogramms
- Metriken sind wichtig
- A/B-Testing-Suche: Denken wie ein Wissenschaftler
- Abfragetriage: Die Geheimwaffe für Suchrelevanz
- Der Launch-Review: Alles zusammenbringen…
Drei Säulen der Suchrelevanz (von Andreas Wagner)
- Teil 1: Auffindbarkeit
- Teil 2: Suchqualität für Entdeckung und Inspiration
Architektur
- Die Kunst der Abstraktion – Neuinterpretation der Webshop-Architektur
- Canva – Suchpipeline
- Teil eins: Überblick über die Herausforderungen
- Zweiter Teil: Neue Sucharchitektur
- Ereignisgesteuerte Architektur für eine effiziente Suchindizierung
Bildung und Vernetzung
Konferenzen
- Aktivieren
- Berliner Schlagwort
- Heuhaufen
- Elastisch{EIN}
- MIX-CAMP E-COMMERCE-SUCHE
- SIGIR E-Commerce
Schulungen und Kurse
Durch maschinelles Lernen unterstützte Suche. Doug Turnbull Weiter: 24. Januar 2023
OpenSource-Verbindungen
- Elasticsearch „Denken Sie wie ein Relevanzingenieur“
- Solr „Denken Sie wie ein Relevanzingenieur“
- Über die Suchrelevanz hinaus: Die Qualität von Suchergebnissen verstehen und messen
- Hallo LTR
Seases Schulungen
Suchgrundlagen. Daniel Tunkelang, Grant Ingersoll Weiter: 6. Februar 2023
Suche mit maschinellem Lernen. Daniel Tunkelang, Grant Ingersoll Weiter: 27. Februar 2023
Suche nach Produktmanagern. Daniel Tunkelang Weiter: 3. April 2023
Sematexts Solr-, Elasticsearch- und OpenSearch-Schulungen
Herbst 2023
https://dtunkelang.medium.com/upcoming-search-classes-this-fall-58f877fe00ad
Bücher
- KI-gestützte Suche
- Relevante Suche
- Deep Learning für die Suche
- Interaktionen mit Suchsystemen
- Einbettungen in die Verarbeitung natürlicher Sprache. Theorie und Fortschritte in der Vektordarstellung von Bedeutung
- Benutzeroberflächen durchsuchen
- Suchmuster
- Suchanalysen für Ihre Website: Gespräche mit Ihren Kunden
- Klicken Sie auf Modelle für die Websuche
- Optimierungsalgorithmen
Blogs und Portale
Papiere
Management, Suchteam
- Suchen ist ein Mannschaftssport
- Gedanken zum Verwalten von Suchteams
- Über Search Leadership
- Aufbau eines effektiven Suchteams: der Schlüssel zu großartiger Suche und Relevanz
- Abfragetriage: Die Geheimwaffe für Suchrelevanz
- Der Launch Review: alles zusammenbringen
- Die Rolle der Eigentümer von Suchprodukten
- Search Product Management: Die am meisten missverstandene Rolle in der Suche?
- Suchrelevanz für unterbesetzte Teams
Vorstellungsgespräche
- Interviewfragen für Search Relevance Engineers, Data Scientists und Produktmanager
- Data Science-Interviews: Ranking und Suche
Maschinenbau
- Technische Schulden auf der Suche
Blogpost-Reihe
Suchoptimierung 101 (von Charlie Hull)
- Woher weiß ich, dass meine Suche fehlerhaft ist?
- Was bedeutet es, wenn meine Suche „fehlerhaft“ ist?
- Wie repariert man eine fehlerhafte Suche?
- Reduzierung des Geschäftsrisikos durch Optimierung der Suche
Abfrageverständnis (von Daniel Tunkelang)
Bessere Suche durch Abfrageverständnis.
- Eine Einführung
- Sprachidentifikation
- Zeichenfilterung
- Tokenisierung
- Rechtschreibkorrektur
- Stemming und Lemmatisierung
- Umschreiben von Abfragen: Ein Überblick
- Abfrageerweiterung
- Abfrageentspannung
- Abfragesegmentierung
- Abfragebereich
- Entitätsanerkennung
- Taxonomien und Ontologien
- Automatische Vervollständigung
- Autovervollständigung und Benutzererfahrung
- Kontextbezogenes Abfrageverständnis: Ein Überblick
- Sitzungskontext
- Ort als Kontext
- Saisonalität
- Personalisierung
- Suche als Konversation
- Klärungsdialoge
- Relevanz-Feedback
- Facettierte Suche
- Präsentation der Suchergebnisse
- Suchergebnis-Snippets
- Clustering von Suchergebnissen
- Beantwortung von Fragen
- Abfrageverständnis und Sprachschnittstellen
- Abfrageverständnis und Chatbots
Gitterdynamik
- Nicht die Suchmaschine Ihres Vaters: eine kurze Geschichte der Einzelhandelssuche
- Semantische Vektorsuche: die neue Grenze in der Produktfindung
- Steigern Sie die Produkterkennung durch semantische Suche
- Blaupause für das Semantische Abfrage-Parsing
Überlegungen zur Suche: Suchthemen (von Derek Sisson)
- Einführung
- Annahmen zur Suche
- Annahmen zum Suchverhalten der Benutzer
- Arten von Informationssammlungen
- Ein struktureller Blick auf die Suche
- Benutzer und die Aufgabe des Informationsabrufs
- Suche testen
- Nützliche Suchlinks und Referenzen
Branchenakteure
Persönlichkeiten und Influencer
- Daniel Tunkelang (er ist Gott der Suche)
- Max Irwin
- Doug Turnbull
- Baymards Institut
Suchmaschinen
- Google
- Bing
- Yandex
- Amazonas
- eBay
Produkte und Dienstleistungen
- Algolia
- Vespa
- Elasticsearch – Verteilte Such- und Analyse-Engine
- Solr – Solr ist die blitzschnelle, multimodale Open-Source-Suchplattform, die auf den Volltext-Vektor- und Geodatensuchfunktionen von Apache Lucene basiert
- Fess Enterprise Search Server
- Typesense – eine Open-Source-Alternative zu Algolia.
- SearchHub.io
- Datafari – eine Open-Source-Unternehmenssuchlösung.
- Qdrant – eine Open-Source-Vektordatenbank.
- Awakari – Echtzeitsuche aus unbegrenzten Quellen wie RSS, Fediverse, Telegram. Textschlüsselwort-Übereinstimmungsbedingungen, numerische Bedingungen, Bedingungsgruppen. Indexbasierte Rückwärtssuche.
- Meilisearch – Open-Source-Such-API, die Volltext-, Vektor-, Geodaten- und Facettensuche unterstützt
Beratungsunternehmen
- BigData-Boutique
- OpenSource-Verbindungen
- https://sease.io/
- Sematext
Fallstudien
- Airbnb – Auf maschinellem Lernen basierendes Suchranking von Airbnb-Erlebnissen
- Airbnb – Einbettungen von Einträgen in das Suchranking
- Algolia – Die Architektur des verteilten Suchnetzwerks von Algolia
- Meituan – Erforschung und Praxis von BERT im Kernranking der Meituan-Suche (?? BERT在美团搜索核心排序的探索和实践)
- Netflix – Wie Netflix Content Engineering einen Verbundgraphen durchsuchbar macht (Teil 1, Teil 2)
- Netflix – Elasticsearch-Indexierungsstrategie in der Asset Management Platform (AMP)
- Skyscanner – Ranking für die Suche nach Flugrouten lernen
- Slack – Suche bei Slack
- Twitter – Stabilität und Skalierbarkeit für die Suche
- Amazon SEO erklärt: So platzieren Sie Ihre Produkte im Jahr 2020 auf Platz 1 der Amazon-Suchergebnisse
- Aufbau einer besseren Suchmaschine für semantische Wissenschaftler
Allgemeine Suche
- Wie Bing Suchergebnisse einordnet: Kernalgorithmus und blaue Links
- So funktioniert das Google-Suchranking – Darwinismus in der Suche
E-Commerce
Vielseitige Märkte
- Entdecken Sie, wie Cassini (die eBay-Suchmaschine) funktioniert und wie Sie ranken
Videos
Kurze Tipps zu Apache Solr
Kanäle
- Klare Gedanken
- Lucidworks
- MIx-Camp E-Commerce-Suche
- OpenSource-Verbindungen
- SIGIR eCom
Hervorgehoben
Datensätze
- Datensatz zu Einkaufsabfragen: Ein groß angelegter ESCI-Benchmark zur Verbesserung der Produktsuche
- ESCI-S: erweiterte Metadaten für den Amazon ESCI-Datensatz
- Relevanz der Home Depot-Produktsuche
- WANDS – Wayfair ANnotation-Datensatz
Werkzeuge
Spacig
Awesome Spacy – Verbesserung der natürlichen Sprache, Bereicherung von Inhalten usw.
Word2Vec
- Word2Vec für Phrasen – Einbettungen für mehr als ein Wort lernen
- Gensim Word2Vec-Tutorial
- So integrieren Sie Phrasen in Word2Vec – ein Text-Mining-Ansatz
- Word2Vec – ein kleiner Schritt im Deep Learning, aber ein großer Schritt in Richtung Natural Language Processing
- So entwickeln Sie Worteinbettungen in Python mit Gensim
Bibliotheken
- Abfragesegmentierer
- https://github.com/zentity-io/zentity
- https://github.com/mammothb/symspellpy
- https://github.com/searchhub/search-collector
- Kiri – Modernste semantische Suche leicht gemacht.
- Haystack – End-to-End-Python-Framework zum Erstellen natürlichsprachlicher Suchschnittstellen für Daten.
- https://github.com/castorini/docTTTTTquery
Andere
- Chor, Smui, Querqy
- Komisch
- Bewerteter Ranking-Bewerter
- Jina AI – Ein neuronales Suchframework
Andere tolle Sachen
- Tolle Wissensgraphen
- Tolle Zeitreihe
- Fantastisch spacig
- Abfrage-Verständnis
- Klicken Sie auf Modelle