Recherche géniale
Soutenez la lutte ukrainienne pour la liberté
NAVIRE DE GUERRE RUSSE, VA VOUS FAIRE FAIRE
Je crée des applications de recherche pour le commerce électronique depuis près de dix ans. Vous trouverez ci-dessous une liste de (quelques) publications, conférences et livres qui m'inspirent. Regroupé par sujet (si un article s'inscrit dans plusieurs sujets, il est divisé en plusieurs sections).
Mettez-nous en vedette sur GitHub — ça aide !
Consultez également mes autres collections de commerce électronique génial, de graphiques de connaissances impressionnants, d'applications cloud géniales
Sujets
- Général, ludique, philosophie
- Types de recherche
- Recherche classique/lexicale
- Vecteurs/Recherche sémantique
- Intégrations
- Types de vecteurs
- Vecteurs denses
- Encastrements de matriochka
- Vecteurs clairsemés
- Modèles d'encodeurs
- Principales architectures
- Interaction des jetons de requête/document
- Aucune interaction - Deux tours / Bi-encodeurs
- Premières interactions - Encodeurs croisés
- Interactions tardives - ColBERT
- Gestion des intégrations de grande dimension
- Réduction de dimensionnalité
- Quantification
- Quantification scalaire
- Quantification binaire
- Recherche sémantique symétrique et asymétrique
- Recherche hybride
- Fusion de rangs réciproques - RRF
- Recherche multimodale
- Domaines d'application
- Recherche d'entreprise
- Recherche de commerce électronique
- Recherche conversationnelle
- Recherche géospatiale
- Recherche médicale et de soins de santé
- Recherche de médias sociaux et de contenu généré par les utilisateurs
- Systèmes de réponses aux questions
- Gestion des informations personnelles
- Résultats de la recherche
- Récupération
- Pertinence
- Algorithmes de pertinence
- Classement
- Classement multi-étapes
- Apprendre à classer
- Cliquez sur les modèles pour rechercher
- Biais
- Diversification
- Personnalisation
- Aucun résultat de recherche
- Recherche UX
- Institut Baymard
- Groupe Nielsen Norman
- Entreprise Connaissance LLC
- Facettes
- Autre
- Correction orthographique
- Suggestions
- Synonymes
- Mots vides
- Graphiques/Taxonomies/Graphique de connaissances
- Intégration des graphiques de recherche et de connaissances (par Enterprise Knowledge)
- Expansion des requêtes
- Compréhension des requêtes
- Intention de recherche
- Segmentation des requêtes
- Algorithmes
- BERTE
- ColBERT
- Collocations, expressions courantes
- Autres algorithmes
- Suivi, profilage, RGPD, Analyse
- Expériences
- Évaluation de la recherche
- MRR
- Tests, métriques, KPI
- Évaluation de la recherche (par Daniel Tunkelang)
- Mesurer la recherche (par James Rubinstein)
- Trois piliers de la pertinence de la recherche (par Andreas Wagner)
- Architecture
- Recherche de vecteurs
- Éducation et réseautage
- Conférences
- Formations et cours
- Livres
- Blogs et portails, Actualités
- Papiers
- Gestion, équipe de recherche
- Entretiens d'embauche
- Ingénierie
- Acteurs de l'industrie
- Personnalités et influenceurs
- Moteurs de recherche
- Produits et services
- Sociétés de conseil
- Série d'articles de blog
- Optimisation de la recherche 101 (par Charlie Hull)
- Compréhension des requêtes (par Daniel Tunkelang)
- Dynamique de la grille
- Considérer la recherche : sujets de recherche (par Derek Sisson)
- Vidéos
- Études de cas
- Recherche générale
- Des marchés multifaces
- Commerce électronique
- Ensembles de données
- Outils
Non trié
- bac à sable juin 2021
- bac à sable mai 2021
- bac à sable avril 2021
- bac à sable décembre 2020
- bac à sable janvier 2020
Général, ludique, philosophie
- Les mensonges que croient les programmeurs à propos de la recherche
- Recherche éthique : concevoir un voyage irrésistible avec un impact positif
- Sur la recherche sémantique
- Dette de rétroaction : ce que le segway enseigne aux équipes de recherche
- Soutenir le parcours du chercheur : quand et comment
- Le shopping est difficile, allons chercher !
- Une introduction à la qualité de la recherche
- Modèles de conception de recherche sur site pour le commerce électronique : structure de schéma, classement basé sur les données, etc.
- À la recherche du rappel
- Équilibrez votre budget de recherche !
Types de recherche
- Évolution de la technologie de recherche : un aperçu de l'avenir
Recherche classique/lexicale
- Etsy. Ciblage des requêtes larges dans la recherche
- Comment Etsy utilise la thermodynamique pour vous aider à rechercher « Geeky »
- Requêtes de recherche larges et ambiguës
- Déconstruire la recherche dans le commerce électronique : les 12 types de requêtes
Vecteurs/Recherche sémantique
Migration vers Elasticsearch avec vecteur dense pour le moteur de recherche Carousell Spotlight
De zéro au modèle d'intégration de la recherche sémantique
Lignes directrices pour choisir un indice
Série pomme de pin
- Index des voisins les plus proches pour la recherche de similarité
- La clause WHERE manquante dans la recherche de vecteurs
Expérience de recherche innovante avec Amazon OpenSearch et Amazon Bedrock
Recherche sémantique symétrique et asymétrique
- Recherche sémantique symétrique ou asymétrique
Intégrations
Espèces
- Bi-encodeur vs encodeur croisé ? Quand utiliser lequel ?
- Qu'est-ce que ColBERT et l'interaction tardive et pourquoi sont-ils importants dans la recherche ?
Modèles d'encodeurs
- Choisir le meilleur modèle de recherche sémantique
Interaction des jetons de requête/document
Aucune interaction - Deux tours / Bi-encodeurs
Premières interactions - Encodeurs croisés
Interactions tardives - ColBERT
- Annonce de l'intégrateur Vespa ColBERT
- Qu'est-ce que ColBERT et l'interaction tardive et pourquoi sont-ils importants dans la recherche ?
Vecteurs denses
Encastrements de matriochka
- Intégrations Matryoshka : recherche de vecteurs OpenAI plus rapide à l'aide de la récupération adaptative
- Introduction aux modèles d'intégration de Matriochka
- Représentations de Matriochka. Un guide pour une recherche sémantique plus rapide
Vecteurs clairsemés
SPLADE
- Recherche hybride : SPLADE (Sparse Encoder)
- SPLADE pour la recherche de vecteurs clairsemés expliqué
Gestion des intégrations de grande dimension
Réduction de dimensionnalité
Quantification
Intégrations binaires
Recherche hybride
- Recherche hybride > somme de ses parties ?
- Sur la recherche hybride
- Recherche hybride avec reclassement
Fusion de rangs réciproques (RRF)
- Recherche hybride avec reclassement
- Fusion de rangs réciproques
Recherche multimodale
- Muves : recherche vectorielle multimodale et multilingue avec accélération matérielle
- Sélection de modèles pour la recherche multimodale
Domaines d'application
Recherche d'entreprise
- GenAI peut améliorer la recherche d'entreprise, mais reste un travail en cours
Recherche de commerce électronique
- L'influence des algorithmes TF-IDF dans la recherche de commerce électronique
Recherche conversationnelle
- Rechercher en tant que conversation
- Possibilités pour la recherche conversationnelle
- Compréhension des requêtes et chatbots
Résultats de la recherche
Récupération
Pertinence
- Les humains recherchent des choses et non des cordes
- Qu'est-ce qu'un résultat de recherche « pertinent » ?
- Comment atteindre la pertinence de la recherche de commerce électronique
- Mise en place d'un programme d'évaluation de la pertinence
Algorithmes de pertinence
- Comprendre l'algorithme de recherche en texte intégral BM25
- BM25 pratique : comment les fragments affectent la notation de pertinence dans Elasticsearch, l'algorithme BM25 et ses variables
- L'influence des algorithmes TF-IDF dans la recherche de commerce électronique
- BM25 La nouvelle génération de pertinence Lucene
- Similitudes Lucène (BM25, DFR, DFI, IB, LM) expliquées
Classement
Classement en plusieurs étapes
Apprendre à classer
- En quoi la recherche est-elle différente des autres problèmes d’apprentissage automatique ?
- Classement de recherche assisté par apprentissage par renforcement
- Reclassement de la recherche de commerce électronique en tant que problème d'apprentissage par renforcement
- Quand utiliser un classement de recherche appris par machine ou basé sur des scores
- Qu’est-ce qu’apprendre à classer ?
- Utiliser l’IA et l’apprentissage automatique pour surmonter les biais de positionnement dans Adobe Stock Search
- Diviser les ensembles d'entraînement et de test pour évaluer l'apprentissage du classement des modèles
- Comment fonctionne LambdaMART - optimisation des objectifs de classement des produits
Cliquez sur les modèles pour rechercher
- Cliquez sur les modèles
- Cliquez sur Modélisation pour le commerce électronique
- Utiliser les données comportementales pour améliorer la recherche
Biais
- Qu’est-ce que le biais de présentation dans la recherche ?
- Gérer les biais de position dans les recommandations et la recherche
Diversification
- Diversification des résultats de recherche à l'aide de modèles de langage causal
- Apprendre à se diversifier pour la recherche de commerce électronique avec Multi-Armed Bandit
- Qualité de recherche pour la découverte et l'inspiration
- Comment mesurer la diversité des résultats de recherche
- À la recherche de Boucle d’or
- Requêtes de recherche larges et ambiguës – Reconnaître quand les résultats de recherche nécessitent une diversification
- Réflexions sur la diversité des résultats de recherche
Personnalisation
- Modèles de personnalisation dans les recommandations et la recherche
- Daniel Tunkelang Personnalisation
- Airbnb - Personnalisation en temps réel dans la recherche
- 98 points de données personnelles que Facebook utilise pour vous cibler des publicités
- Architecture des systèmes de recommandation du monde réel
- Ingénierie des fonctionnalités pour une recherche personnalisée
Aucun résultat de recherche
- Stratégies d'utilisation de requêtes alternatives pour atténuer les résultats nuls et leur application aux marchés en ligne
- Équivalence sémantique des requêtes de commerce électronique
Recherche UX
Institut Baymard
- Déconstruire la recherche dans le commerce électronique : les 12 types de requêtes
- Diriger automatiquement ou guider les utilisateurs vers la catégorie correspondante
- 13 modèles de conception pour les suggestions de saisie semi-automatique (27 % se trompent)
- La recherche de commerce électronique doit prendre en charge les requêtes de recherche non liées aux produits des utilisateurs (15 % ne le font pas)
- Search UX : 6 éléments essentiels pour les pages « Aucun résultat »
- Les miniatures des produits doivent être mises à jour dynamiquement pour correspondre à la variante recherchée (54 % ne le font pas)
- Tri à facettes - Une nouvelle méthode de tri des résultats de recherche
- L'état actuel de la recherche sur le commerce électronique
- Les sites de commerce électronique ont besoin de plusieurs de ces 5 fonctionnalités de « portée de recherche »
- Conception des champs de recherche pour le commerce électronique et ses implications
- Les sites de commerce électronique devraient inclure des extraits de recherche contextuels (96 % se trompent)
- Convivialité de la recherche dans le commerce électronique : rapport et analyse comparative
- Six améliorations UX du commerce électronique liées au « COVID-19 » à apporter
Groupe Nielsen Norman
- Le modèle de regard du coup de foudre sur les pages de résultats de recherche
- Bon abandon sur les pages de résultats de recherche
- Les pages de résultats de recherche complexes modifient le comportement de recherche : le modèle Pinball
- Suggestions de recherche sur le site
- Analyse des journaux de recherche : l'opportunité la plus négligée dans la recherche Web UX
- Recherche étendue : dangereuse, mais parfois utile
- 3 lignes directrices pour les pages « Aucun résultat » des moteurs de recherche
Entreprise Connaissance LLC
- Optimiser votre expérience de recherche : une approche centrée sur l'humain de la conception de la recherche
Facettes
- Facettes de la recherche à facettes
- Café, café, café !
- Recherche à facettes (commencez ici !)
- Comment mettre en œuvre la recherche à facettes de la bonne manière
- Métadonnées et recherche à facettes
- Metacrap : Remettre le flambeau aux sept hommes de paille de la méta-utopie
- 7 implémentations de filtrage qui font de Macy's le meilleur de sa catégorie
- Recherche de facettes : le guide le plus complet. Meilleures pratiques, modèles de conception, mises en garde cachées et solutions de contournement
- Facettes : contraintes ou préférences ?
- Des facettes, mais lesquelles ?
Taxonomiste accidentel
- Combien de facettes une taxonomie doit-elle avoir
- Quand une taxonomie ne doit pas être hiérarchique
- Personnalisation des facettes de la taxonomie
Autre
- Apprendre de la friction pour améliorer l’expérience de recherche
- Pourquoi est-il si difficile de trier par prix ?
- Tri à facettes
- Google tue la recherche instantanée
Correction orthographique
- Peter Norvig. "Comment rédiger un correcteur orthographique". Édition classique.
- Daniel Tunkelang. "Correction orthographique"
- Un correcteur orthographique simple construit à partir de vecteurs de mots
- Un examen plus approfondi du problème de correction orthographique : 1, 2, 3, preDict
- Orthographe profonde
- Modélisation de la correction orthographique pour la recherche sur Etsy
- Costume de loup. Auteur de Sympell. Algorithme de correction orthographique 1000 fois plus rapide, SymSpell en surbrillance par rapport à BK-tree : recherche de chaînes floues et vérification orthographique 100 fois plus rapides, segmentation rapide des mots du texte bruyant
- Chars2vec : modèle de langage basé sur les caractères pour gérer des textes du monde réel comportant des fautes d'orthographe et
- JamSpell, correction orthographique prenant en compte le contexte environnant - bibliothèque, (en russe) Исправляем опечатки с учётом контекста
- Intégration pour la correction orthographique
- Un correcteur orthographique simple construit à partir de vecteurs de mots
- Quels sont les algorithmes de correction orthographique utilisés par les moteurs de recherche ?
- Moman - la correction orthographique/correction automatique lucene/solr/elasticsearch est (était ?) réellement alimentée par cette bibliothèque.
- Segmentation des requêtes et correction orthographique
- Application de la vérification orthographique contextuelle dans Spark NLP
- Correction automatique dans Google, Amazon et Pinterest et comment rédiger la vôtre
Synonymes
- Augmenter la puissance d'Elasticsearch avec des synonymes
- De vraies discussions sur les synonymes et la recherche
- Synonymes dans Solr I — Le bon, le mauvais et le laid
- Synonymes et antonymes de WordNet
- Synonymes et antonymes en Python
- Plongez dans WordNet avec NLTK
- Créer de meilleures recherches grâce à la détection automatique des synonymes
- Synonymes multimots dans la recherche à l’aide de Querqy
- Comment créer un modèle de synonymes intelligent
- L'importance des synonymes dans la recherche de commerce électronique
Mots vides
- Les requêtes utilisant uniquement des mots vides sont-elles importantes ?
Suggestions
Synonymes : saisie semi-automatique, recherche au fur et à mesure de la frappe, suggestions
- Giovanni Fernández-Kincade. Amorçage de la suggestion automatique, Création d'un corpus de suggestion automatique, Partie 1, Création d'un corpus de suggestion automatique, Partie 2, Structures et algorithmes de données de récupération de suggestion automatique, Classement de suggestion automatique
- Sur deux types de suggestions
- Améliorer les suggestions de recherche pour le commerce électronique
- Meilleures pratiques de recherche à saisie semi-automatique pour augmenter les conversions
- Pourquoi nous avons développé le module SearchHub smartSuggest et pourquoi cela peut vous intéresser
- Groupe Nielsen Norman : Suggestions de recherche sur le site
- 13 modèles de conception pour les suggestions de saisie semi-automatique
- Saisie semi-automatique
- Saisie semi-automatique et expérience utilisateur
- IMPLÉMENTATION D'UNE RECHERCHE LINKEDIN LIKE PENDANT QUE VOUS TYPES AVEC ELASTICSEARCH
- Bonnes pratiques de saisie semi-automatique intelligente : améliorez la pertinence de la recherche et les ventes
- OLX : création d'un corpus pour AutoSuggest (partie 1), récupération et classement AutoSuggest (partie 2)
- Saisie semi-automatique, suggestions de recherche en direct et correction automatique : modèles de conception de bonnes pratiques
- Miroir, miroir, qu'est-ce que je tape ensuite ? Tout sur les suggestions de recherche
- Comment nous avons créé la suggestion automatique ultra-rapide pour otto.de
Graphiques/Taxonomies/Graphique de connaissances
Graphiques de connaissances appliqués au secteur de la vente au détail
Les graphes de connaissances sont de plus en plus populaires dans le secteur technologique. Nous explorons comment ils peuvent être utilisés dans le secteur de la vente au détail pour enrichir les données, élargir les résultats de recherche et ajouter de la valeur à une entreprise de vente au détail.
Graphiques de connaissances impressionnants
Intégration des graphiques de recherche et de connaissances (par Enterprise Knowledge)
- Partie 1 : Afficher les relations
- Expansion des requêtes de recherche avec intégrations de requêtes
Expansion des requêtes
- Fondamentaux de la réécriture de requêtes (partie 1) : introduction à l'expansion des requêtes
Compréhension des requêtes
- Compréhension des requêtes Daniel Tunkelang.
- Compréhension des requêtes, divisée en trois parties
- Rechercher des choses et non des chaînes
- Comprendre la requête de recherche. Partie 1, Partie 2, Partie 3
- Découverte d'aliments avec Uber Eats : création d'un moteur de compréhension des requêtes
- IA pour la compréhension des requêtes
Intention de recherche
- Mappage des requêtes de recherche aux intentions de recherche
- Recherche : intention, pas inventaire
Segmentation des requêtes
- Segmentation des requêtes papier non supervisée à l'aide uniquement des journaux de requêtes
- Article vers la segmentation sémantique des requêtes
Algorithmes
BERTE
- Comprendre le BERT et la pertinence de la recherche
- Google améliore la recherche sur le Web avec BERT : pouvons-nous également l'utiliser pour la recherche d'entreprise ?
ColBERT
- Modèles de langage de transformateur pré-entraînés pour la recherche - PARTIE 3
Collocations, expressions courantes
- Détectez automatiquement les phrases courantes – expressions multi-mots / n-grammes de mots – à partir d’un flux de phrases.
- L’efficacité déraisonnable des collocations
Autres algorithmes
- Un encodage à chaud
- Rédaction d'un moteur de recherche en texte intégral à l'aide des filtres Bloom
Hachage
- Hachage sensible à la localité
- Hachage sensible à la localité (LSH) : le guide pratique et illustré
- Minhash
Tri par notes moyennes
- Mieux que la moyenne : trier par meilleure note
- Comment ne pas trier par note moyenne
Extraction de mots-clés
- Extraction de mots clés à l'aide de RAKE
- Encore un autre extracteur de mots clés (Yake)
- Extraction de mots clés avec BERT
Suivi, profilage, RGPD, Analyse
Outils, plateformes, aides pour le suivi de recherche
- Informations sur le comportement des utilisateurs OpenSearch
- Suivi de la recherche sur site avec Google Analytics 4
- Chasse-neige
- collectionneur de recherche
- OpenTelemetry avec ajouts de recherche
- Analyse des requêtes pulsées
- Suivre qui est sexy et qui ne l'est pas présente un défi algorithmique
Ressources
- Anonymisation : gérer les risques liés à la protection des données (code de bonnes pratiques)
- Le cadre décisionnel en matière d’anonymisation
- 98 points de données personnelles que Facebook utilise pour vous cibler des publicités
- Analyse des opportunités pour la recherche
- Un visage est exposé pour le chercheur AOL n° 4417749
- Fuite de données de recherche AOL
- Données personnelles
Expériences
- Pièges courants de l’expérimentation de la recherche
- Améliorer Search @scale grâce à une expérimentation efficace des requêtes
Tests A/B, MAB
- Les tests A/B pour la recherche sont différents
- A/B Testing Search : penser comme un scientifique
Tests, métriques, KPI
Métrique
- Gain cumulé actualisé
- Saveurs de NDCG - normalisées à quoi !?
- Rang réciproque moyen
- Pk
- Démystifier le nDCG et l’ERR
- Choisir votre métrique d'évaluation de la pertinence de la recherche
- Comment mettre en œuvre un scoreur de qualité de classement de gain cumulatif actualisé normalisé (NDCG) dans Quepid
- https://en.wikipedia.org/wiki/Precision_and_recall
- https://en.wikipedia.org/wiki/F1_score
- Visualiser les métriques de recherche
- Choisir votre métrique d'évaluation de la pertinence de la recherche
- Calculer le rang réciproque moyen (MRR) à l'aide de Pandas
- Systèmes de recommandation : métriques d'apprentissage automatique et métriques commerciales
KPI
- 5 bonnes façons de mesurer les performances de la recherche
- KPI de recherche sur les sites de commerce électronique. Partie 1 – Clients, Partie 2 – Produits, Partie 3 – Requêtes
- Apprendre de la friction pour améliorer l’expérience de recherche
- Derrière la magie d'une expérience de recherche transparente
- Analyser les métriques de pertinence des recherches en ligne avec la Suite Elastic
- Comment obtenir des informations grâce à l'analyse de recherche
Évaluation de la recherche (par Daniel Tunkelang)
- Mesurez-le
- Mesurer le comportement des chercheurs
- Utiliser le jugement humain
- Quand il n'y a pas de taux de conversion
Mesurer la recherche (par James Rubinstein)
- Approches statistiques et centrées sur l'humain pour l'amélioration des moteurs de recherche
- Une approche humaine
- Mise en place d'un programme d'évaluation de la pertinence
- Les mesures comptent
- A/B Testing Search : penser comme un scientifique
- Triage des requêtes : l'arme secrète pour la pertinence de la recherche
- La revue de lancement : tout rassembler…
Trois piliers de la pertinence de la recherche (par Andreas Wagner)
- Partie 1 : Trouvable
- partie 2 : Qualité de recherche pour la découverte et l'inspiration
Architecture
- L'art de l'abstraction – revisiter l'architecture de la boutique en ligne
- Canva – Pipeline de recherche
- Première partie : aperçu des défis rencontrés
- Deuxième partie, nouvelle architecture de recherche
- Architecture basée sur les événements pour une indexation de recherche efficace
Éducation et réseautage
Conférences
- Activer
- Mot à la mode berlinois
- Meule de foin
- Élastique{ON}
- RECHERCHE E-COMMERCE MIX-CAMP
- Commerce électronique SIGIR
Formations et cours
Recherche basée sur l'apprentissage automatique. Doug Turnbull Suivant : 24 janvier 2023
Connexions Open Source
- Elasticsearch « Pensez comme un ingénieur en pertinence »
- Solr "Pensez comme un ingénieur en pertinence"
- Au-delà de la pertinence de la recherche : comprendre et mesurer la qualité des résultats de recherche
- Bonjour LTR
Les formations de Sease
Fondamentaux de recherche. Daniel Tunkelang, Grant Ingersoll Suivant : 6 février 2023
Recherchez avec l’apprentissage automatique. Daniel Tunkelang, Grant Ingersoll Suivant : 27 février 2023
Recherchez des chefs de produit. Daniel Tunkelang Suivant : 3 avril 2023
Formations Solr, Elasticsearch et OpenSearch de Sematext
Automne 2023
https://dtunkelang.medium.com/upcoming-search-classes-this-fall-58f877fe00ad
Livres
- Recherche basée sur l'IA
- Recherche pertinente
- Deep Learning pour la recherche
- Interactions avec les systèmes de recherche
- Intégrations dans le traitement du langage naturel. Théorie et progrès dans la représentation vectorielle du sens
- Rechercher des interfaces utilisateur
- Modèles de recherche
- Analyse de recherche pour votre site : conversations avec vos clients
- Cliquez sur Modèles pour la recherche sur le Web
- Algorithmes d'optimisation
Blogs et portails
Papiers
Gestion, équipe de recherche
- La recherche est un sport d'équipe
- Réflexions sur la gestion des équipes de recherche
- Sur le leadership en matière de recherche
- Construire une équipe de recherche efficace : la clé d'une recherche et d'une pertinence optimales
- Triage des requêtes : l'arme secrète pour la pertinence de la recherche
- La Revue de Lancement : tout rassembler
- Le rôle des propriétaires de produits de recherche
- Gestion des produits de recherche : le rôle le plus mal compris dans la recherche ?
- Pertinence de la recherche pour les équipes en sous-effectif
Entretiens d'embauche
- Questions d'entretien pour les ingénieurs en pertinence de recherche, les scientifiques des données et les chefs de produit
- Entretiens en science des données : classement et recherche
Ingénierie
- Dette technique en recherche
Série d'articles de blog
Optimisation de la recherche 101 (par Charlie Hull)
- Comment puis-je savoir que ma recherche est interrompue ?
- Qu'est-ce que cela signifie si ma recherche est « interrompue » ?
- Comment réparer une recherche interrompue ?
- Réduire les risques commerciaux en optimisant la recherche
Compréhension des requêtes (par Daniel Tunkelang)
Meilleure recherche grâce à la compréhension des requêtes.
- Une introduction
- Identification de la langue
- Filtrage des caractères
- Tokenisation
- Correction orthographique
- Racinage et lemmatisation
- Réécriture de requêtes : un aperçu
- Expansion des requêtes
- Assouplissement des requêtes
- Segmentation des requêtes
- Portée des requêtes
- Reconnaissance d'entité
- Taxonomies et ontologies
- Saisie semi-automatique
- Saisie semi-automatique et expérience utilisateur
- Compréhension des requêtes contextuelles : un aperçu
- Contexte de la séance
- Localisation comme contexte
- Saisonnalité
- Personnalisation
- Rechercher en tant que conversation
- Dialogues de clarification
- Pertinence
- Recherche à facettes
- Présentation des résultats de recherche
- Extraits de résultats de recherche
- Regroupement des résultats de recherche
- Réponse aux questions
- Compréhension des requêtes et interfaces vocales
- Compréhension des requêtes et chatbots
Dynamique de la grille
- Ce n'est pas le moteur de recherche de votre père : un bref historique de la recherche dans le commerce de détail
- Recherche de vecteurs sémantiques : la nouvelle frontière de la découverte de produits
- Stimuler la découverte de produits grâce à la recherche sémantique
- Modèle d'analyse de requêtes sémantiques
Considérer la recherche : sujets de recherche (par Derek Sisson)
- Introduction
- Hypothèses sur la recherche
- Hypothèses sur le comportement de recherche des utilisateurs
- Types de collectes d'informations
- Un regard structurel sur la recherche
- Les utilisateurs et la tâche de recherche d'informations
- Recherche de tests
- Liens de recherche et références utiles
Acteurs de l'industrie
Personnalités et influenceurs
- Daniel Tunkelang (il est le Dieu de la recherche)
- Max Irwin
- Doug Turnbull
- Institut Baymard
Moteurs de recherche
- Google
- Bing
- Yandex
- Amazone
- eBay
Produits et services
- Algolie
- Vespa
- Elasticsearch - Moteur de recherche et d'analyse distribué
- Solr - Solr est la plate-forme de recherche multimodale open source ultra-rapide construite sur les capacités de recherche vectorielle en texte intégral et géospatiales d'Apache Lucene.
- Serveur de recherche d'entreprise Fess
- Typesense - une alternative open source à Algolia.
- SearchHub.io
- Datafari - une solution de recherche d'entreprise open source.
- Qdrant - une base de données vectorielles open source.
- Awakari - Recherche en temps réel à partir de sources illimitées comme RSS, Fediverse, Telegram. Conditions de correspondance de mots clés textuels, conditions numériques, groupes de conditions. Basé sur un index de recherche inversé.
- Meilisearch - API de recherche open source prenant en charge la recherche en texte intégral, vectorielle, géospatiale et à facettes
Sociétés de conseil
- Boutique BigData
- Connexions Open Source
- https://sease.io/
- Sematexte
Études de cas
- Airbnb - Classement de recherche basé sur l'apprentissage automatique des expériences Airbnb
- Airbnb – Liste des intégrations dans le classement de recherche
- Algolia - L'architecture du réseau de recherche distribué d'Algolia
- Meituan - Exploration et pratique du BERT dans le classement principal de la recherche Meituan (?? BERT在美团搜索核心排序的探索和实践)
- Netflix - Comment Netflix Content Engineering rend un graphique fédéré consultable (Partie 1, Partie 2)
- Netflix - Stratégie d'indexation Elasticsearch dans la plateforme de gestion d'actifs (AMP)
- Skyscanner - Apprendre à classer pour la recherche d'itinéraires de vol
- Slack - Rechercher sur Slack
- Twitter - Stabilité et évolutivité pour la recherche
- Amazon SEO expliqué : comment classer vos produits n°1 dans les résultats de recherche Amazon en 2020
- Construire un meilleur moteur de recherche pour Semantic Scholar
Recherche générale
- Comment Bing classe les résultats de recherche : algorithme de base et liens bleus
- Comment fonctionne le classement de recherche Google – Le darwinisme dans la recherche
Commerce électronique
- Recherche et numérisation
Des marchés multifaces
- Découvrez le fonctionnement et le classement de Cassini (le moteur de recherche eBay)
Vidéos
Conseils courts sur Apache Solr
Canaux
- Pensées lucides
- Travaux lucides
- Recherche de commerce électronique MIx-Camp
- Connexions OpenSource
- SIGIR eCom
En vedette
Ensembles de données
- Ensemble de données sur les requêtes d'achat : une référence ESCI à grande échelle pour améliorer la recherche de produits
- ESCI-S : métadonnées étendues pour l'ensemble de données Amazon ESCI
- Pertinence de la recherche de produits Home Depot
- WANDS - Ensemble de données de notation Wayfair
Outils
Spacieux
Awesome Spacy - Compréhension du langage naturel, enrichissement du contenu, etc.
Mot2Vec
- Word2Vec For Phrases - Apprentissage des intégrations pour plus d'un mot
- Tutoriel Gensim Word2Vec
- Comment incorporer des phrases dans Word2Vec – une approche d'exploration de texte
- Word2Vec – un petit pas dans le Deep Learning mais un pas de géant vers le traitement du langage naturel
- Comment développer des intégrations de mots en Python avec Gensim
Libs
- Segmenteur de requêtes
- https://github.com/zentity-io/zentity
- https://github.com/mammothb/symspellpy
- https://github.com/searchhub/search-collector
- Kiri - La recherche sémantique de pointe simplifiée.
- Haystack - Framework Python de bout en bout pour créer des interfaces de recherche en langage naturel avec des données.
- https://github.com/castorini/docTTTTTquery
Autre
- Chœur, Smui, Querqy
- Quepid
- Évaluateur de classement coté
- Jina AI - Un cadre de recherche neuronale
D'autres trucs géniaux
- Graphiques de connaissances impressionnants
- Superbe série chronologique
- Super espace
- Compréhension des requêtes
- Cliquez sur les modèles