Búsqueda impresionante
Apoye la lucha ucraniana por la libertad.
BUQUE DE GUERRA RUSO, VETE A LA MIERDA
Llevo casi diez años creando aplicaciones de búsqueda de comercio electrónico. A continuación puedes encontrar una lista de (algunas) publicaciones, conferencias y libros que me inspiran. Agrupados por tema (si un artículo se ajusta a varios temas, se divide en varias secciones).
Destacanos en GitHub: ¡ayuda!
Consulte también mis otras colecciones: increíble comercio electrónico, increíbles gráficos de conocimiento, increíbles aplicaciones en la nube.
Temas
- General, diversión, filosofía.
- Tipos de búsqueda
- Búsqueda clásica/léxica
- Vectores/Búsqueda semántica
- Incrustaciones
- Tipos de vectores
- Vectores densos
- Incrustaciones de matrioskas
- Vectores dispersos
- Modelos de codificador
- Arquitecturas principales
- Interacción de tokens de consulta/documento
- Sin interacciones - Dos torres / Bi-codificadores
- Interacciones tempranas: codificadores cruzados
- Interacciones tardías - ColBERT
- Manejo de incrustaciones de grandes dimensiones
- Reducción de dimensionalidad
- Cuantización
- Cuantización escalar
- Cuantización binaria
- Búsqueda semántica simétrica y asimétrica
- Búsqueda híbrida
- Fusión de rangos recíprocos - RRF
- Búsqueda multimodal
- Áreas de aplicación
- Búsqueda empresarial
- búsqueda de comercio electrónico
- búsqueda conversacional
- Búsqueda geoespacial
- Búsqueda médica y sanitaria
- Búsqueda de contenido generado por el usuario y redes sociales
- Sistemas de respuesta a preguntas
- Gestión de información personal
- Resultados de la búsqueda
- Recuperación
- Categoría
- Clasificación de varias etapas
- Aprendiendo a clasificar
- Haga clic en modelos para buscar
- Inclinación
- Diversificación
- Personalización
- Cero resultados de búsqueda
- Experiencia de usuario de búsqueda
- Instituto Baymard
- Grupo Nielsen Norman
- Conocimiento empresarial LLC
- facetas
- Otro
- Corrección ortográfica
- Sugerencias
- Sinónimos
- Palabras vacías
- Gráficos/Taxonomías/Gráfico de conocimiento
- Integración de gráficos de conocimiento y búsqueda (por Enterprise Knowledge)
- Expansión de consultas
- Comprensión de consultas
- Intención de búsqueda
- Segmentación de consultas
- Algoritmos
- BERT
- COLBERT
- Colocaciones, frases comunes.
- Otros algoritmos
- Seguimiento, elaboración de perfiles, RGPD, Análisis
- experimentos
- Evaluando la búsqueda
- MRR
- Pruebas, métricas, KPI
- Evaluación de la búsqueda (por Daniel Tunkelang)
- Medición de la búsqueda (por James Rubinstein)
- Tres pilares de la relevancia de la búsqueda (por Andreas Wagner)
- Arquitectura
- Vectores buscar
- Educación y networking
- Conferencias
- Capacitaciones y cursos
- Libros
- Blogs y Portales, Noticias
- Papeles
- Gestión, equipo de búsqueda
- Entrevistas de Trabajo
- Ingeniería
- Actores de la industria
- Personalidades e influencers
- Motores de búsqueda
- Productos y servicios
- Empresas consultoras
- Serie de publicaciones de blog
- Optimización de búsqueda 101 (por Charlie Hull)
- Comprensión de consultas (por Daniel Tunkelang)
- Dinámica de la red
- Considerando la búsqueda: temas de búsqueda (por Derek Sisson)
- Vídeos
- Estudios de caso
- búsqueda general
- Mercados multilaterales
- Comercio electrónico
- Conjuntos de datos
- Herramientas
sin clasificar
- caja de arena junio de 2021
- caja de arena mayo de 2021
- caja de arena abril de 2021
- caja de arena diciembre de 2020
- caja de arena enero de 2020
General, diversión, filosofía.
- Falsedades que los programadores creen sobre la búsqueda
- Búsqueda Ética: Diseñando un viaje irresistible con impacto positivo
- Sobre la búsqueda semántica
- Deuda de retroalimentación: lo que el segway enseña a los equipos de búsqueda
- Apoyando el viaje del buscador: cuándo y cómo
- Comprar es difícil, ¡vamos a buscar!
- Una introducción a la calidad de la búsqueda
- Patrones de diseño de búsqueda en el sitio para comercio electrónico: estructura de esquema, clasificación basada en datos y más
- En busca del recuerdo
- ¡Equilibre su presupuesto de búsqueda!
Tipos de búsqueda
- Evolución de la tecnología de búsqueda: una mirada al futuro
Búsqueda clásica/léxica
- Etsy. Orientación a consultas amplias en la búsqueda
- Cómo Etsy utiliza la termodinámica para ayudarte a buscar "Geeky"
- Consultas de búsqueda amplias y ambiguas
- Deconstruyendo la búsqueda de comercio electrónico: los 12 tipos de consultas
Vectores/Búsqueda semántica
Migración a Elasticsearch con vector denso para el motor de búsqueda Carousell Spotlight
De cero al modelo de incrustación de búsqueda semántica
Pautas para elegir un índice
Serie de piña
- Índices de vecinos más cercanos para búsqueda de similitud
- La cláusula WHERE que falta en la búsqueda de vectores
Experiencia de búsqueda innovadora con Amazon OpenSearch y Amazon Bedrock
Búsqueda semántica simétrica y asimétrica
- Búsqueda semántica simétrica versus asimétrica
Incrustaciones
Tipos
- ¿Bicodificador vs codificador cruzado? ¿Cuándo usar cuál?
- ¿Qué es ColBERT y la interacción tardía y por qué son importantes en la búsqueda?
Modelos de codificador
- Elegir el mejor modelo para la búsqueda semántica
Interacción de tokens de consulta/documento
Sin interacciones - Dos torres / Bi-codificadores
Interacciones tempranas: codificadores cruzados
Interacciones tardías - ColBERT
- Anuncio del integrador Vespa ColBERT
- ¿Qué es ColBERT y la interacción tardía y por qué son importantes en la búsqueda?
Vectores densos
Incrustaciones de matrioskas
- Incorporaciones de Matryoshka: búsqueda vectorial OpenAI más rápida mediante recuperación adaptativa
- Introducción a los modelos de incrustación de Matryoshka
- Representaciones de matrioskas. Una guía para una búsqueda semántica más rápida
Vectores dispersos
ESPALA
- Búsqueda híbrida: SPLADE (codificador disperso)
- SPLADE para búsqueda de vectores dispersos explicado
Manejo de incrustaciones de grandes dimensiones
Reducción de dimensionalidad
Cuantización
Incrustaciones binarias
Búsqueda híbrida
- Búsqueda híbrida > ¿suma de sus partes?
- Sobre la búsqueda híbrida
- Búsqueda híbrida con reclasificación
Fusión de rangos recíprocos (RRF)
- Búsqueda híbrida con reclasificación
- Fusión de rango recíproco
Búsqueda multimodal
- Muves: búsqueda vectorial multimodal y multilingüe con aceleración de hardware
- Selección de modelo para búsqueda multimodal
Áreas de aplicación
Búsqueda empresarial
- GenAI puede mejorar la búsqueda empresarial, pero sigue siendo un trabajo en progreso
búsqueda de comercio electrónico
- La influencia de los algoritmos TF-IDF en la búsqueda de comercio electrónico
búsqueda conversacional
- Buscar como una conversación
- Beneficios para la búsqueda conversacional
- Comprensión de consultas y chatbots
Resultados de la búsqueda
Recuperación
Pertinencia
- Los humanos buscan cosas, no cadenas
- ¿Qué es un resultado de búsqueda "relevante"?
- Cómo lograr la relevancia de la búsqueda de comercio electrónico
- Establecer un programa de evaluación de relevancia
Algoritmos de relevancia
- Comprender el algoritmo de búsqueda de texto completo BM25
- BM25 práctico: cómo los fragmentos afectan la puntuación de relevancia en Elasticsearch, el algoritmo BM25 y sus variables
- La influencia de los algoritmos TF-IDF en la búsqueda de comercio electrónico
- BM25 La próxima generación de relevancia de Lucene
- Similitudes de Lucene (BM25, DFR, DFI, IB, LM) explicadas
Categoría
Clasificación de varias etapas
- Clasificación de varias etapas
Aprendiendo a clasificar
- ¿En qué se diferencia la búsqueda de otros problemas de aprendizaje automático?
- Clasificación de búsqueda asistida por aprendizaje por refuerzo
- La reclasificación de las búsquedas de comercio electrónico como un problema de aprendizaje por refuerzo
- Cuándo utilizar un ranking de búsqueda basado en puntuación o aprendido automáticamente
- ¿Qué es aprender a clasificar?
- Uso de IA y aprendizaje automático para superar el sesgo de posición en Adobe Stock Search
- Conjuntos de entrenamiento y prueba divididos para evaluar el aprendizaje de la clasificación de modelos
- Cómo funciona LambdaMART: optimización de los objetivos de clasificación de productos
Haga clic en modelos para buscar
- Haga clic en modelos
- Modelado de clics para comercio electrónico
- Uso de datos de comportamiento para mejorar la búsqueda
Inclinación
- ¿Qué es el sesgo de presentación en las búsquedas?
- Cómo lidiar con el sesgo de posición en las recomendaciones y la búsqueda
Diversificación
- Diversificación de resultados de búsqueda mediante modelos de lenguaje causal
- Aprender a diversificarse para la búsqueda de comercio electrónico con Multi-Armed Bandit
- Calidad de búsqueda para descubrimiento e inspiración
- Cómo medir la diversidad de los resultados de búsqueda
- Buscando ricitos de oro
- Consultas de búsqueda amplias y ambiguas: reconocer cuándo los resultados de búsqueda necesitan diversificación
- Reflexiones sobre la diversidad de resultados de búsqueda
Personalización
- Patrones para personalización en Recomendaciones y Búsqueda
- Daniel Tunkelang Personalización
- Airbnb - Personalización en tiempo real en la búsqueda
- 98 puntos de datos personales que Facebook utiliza para orientarle anuncios
- Arquitectura de sistemas de recomendación del mundo real.
- Ingeniería de funciones para búsqueda personalizada
Cero resultados de búsqueda
- Estrategias para utilizar consultas alternativas para mitigar los resultados cero y su aplicación a los mercados en línea
- Equivalencia semántica de consultas de comercio electrónico
Experiencia de usuario de búsqueda
Instituto Baymard
- Deconstruyendo la búsqueda de comercio electrónico: los 12 tipos de consultas
- Dirigir automáticamente o guiar a los usuarios a la categoría coincidente
- 13 patrones de diseño para sugerencias de autocompletar (el 27 % se equivoca)
- La búsqueda de comercio electrónico debe respaldar las consultas de búsqueda de los usuarios que no son de productos (el 15% no lo hace)
- Search UX: 6 elementos esenciales para páginas "Sin resultados"
- Las miniaturas de productos deben actualizarse dinámicamente para coincidir con la variación buscada (54% no lo hace)
- Clasificación por facetas: un nuevo método para ordenar los resultados de la búsqueda
- El estado actual de la búsqueda en el comercio electrónico
- Los sitios de comercio electrónico necesitan varias de estas cinco funciones de 'ámbito de búsqueda'
- Diseño de campos de búsqueda de comercio electrónico y sus implicaciones
- Los sitios de comercio electrónico deberían incluir fragmentos de búsqueda contextual (el 96% se equivoca)
- Usabilidad de búsqueda de comercio electrónico: informe y punto de referencia
- Seis mejoras en la experiencia de usuario del comercio electrónico relacionadas con 'COVID-19' que se deben realizar
Grupo Nielsen Norman
- El patrón de mirada de amor a primera vista en las páginas de resultados de búsqueda
- Buen abandono en las páginas de resultados de búsqueda
- Las páginas complejas de resultados de búsqueda cambian el comportamiento de búsqueda: el patrón Pinball
- Sugerencias de búsqueda del sitio
- Análisis de registros de búsqueda: la oportunidad más pasada por alto en la investigación de UX web
- Búsqueda con alcance: peligrosa, pero a veces útil
- Tres pautas para las páginas "Sin resultados" de los motores de búsqueda
Conocimiento empresarial LLC
- Optimización de su experiencia de búsqueda: un enfoque del diseño de búsqueda centrado en las personas
facetas
- Facetas de la búsqueda facetada
- ¡Café, café, café!
- Búsqueda por facetas (¡comience aquí!)
- Cómo implementar la búsqueda por facetas de la manera correcta
- Metadatos y búsqueda por facetas
- Metacrap: Prendiendo la antorcha a siete testaferros de la metautopía
- 7 implementaciones de filtrado que convierten a Macy's en el mejor de su clase
- Búsqueda de facetas: la guía más completa. Mejores prácticas, patrones de diseño, advertencias ocultas y soluciones alternativas
- Facetas: ¿Restricciones o Preferencias?
- Facetas, ¿pero cuáles?
Taxónomo accidental
- ¿Cuántas facetas debe tener una taxonomía?
- Cuando una taxonomía no debería ser jerárquica
- Personalización de facetas de taxonomía
Otro
- Aprender de la fricción para mejorar la experiencia de búsqueda
- ¿Por qué es tan difícil ordenar por precio?
- Clasificación facetada
- Google acaba con la búsqueda instantánea
Corrección ortográfica
- Peter Norvig. "Cómo escribir un corrector ortográfico". Publicación clásica.
- Daniel Tunkelang. "Corrección ortográfica"
- Un corrector ortográfico sencillo creado a partir de vectores de palabras.
- Una mirada más cercana al problema de la corrección ortográfica: 1, 2, 3, preDict
- Ortografía profunda
- Modelado de corrección ortográfica para búsqueda en Etsy
- Lobo Garbe. Autor de Sympell. Algoritmo de corrección ortográfica 1000 veces más rápido, resaltado principal SymSpell frente a BK-tree: búsqueda de cadenas difusas y revisión ortográfica 100 veces más rápida, segmentación rápida de palabras de texto ruidoso
- Chars2vec: modelo de lenguaje basado en caracteres para manejar textos del mundo real con errores ortográficos y
- JamSpell, corrección ortográfica teniendo en cuenta el contexto circundante - biblioteca, (en ruso) Исправляем опечатки с учётом контекста
- Incrustación para corrección ortográfica
- Un corrector ortográfico sencillo creado a partir de vectores de palabras.
- ¿Cuáles son algunos algoritmos de corrección ortográfica que utilizan los motores de búsqueda?
- Moman: lucene/solr/elasticsearch corrección ortográfica/autocorrección en realidad funciona con esta biblioteca.
- Segmentación de consultas y corrección ortográfica
- Aplicación del corrector ortográfico consciente del contexto en Spark NLP
- Autocorrección en Google, Amazon y Pinterest y cómo escribir el tuyo propio
Sinónimos
- Impulsando el poder de Elasticsearch con sinónimos
- Charla real sobre sinónimos y búsqueda
- Sinónimos en Solr I - El bueno, el malo y el feo
- Sinónimos y antónimos de WordNet
- Sinónimos y antónimos en Python
- Sumérgete en WordNet con NLTK
- Creación de mejores búsquedas mediante la detección automática de sinónimos
- Sinónimos de varias palabras en la búsqueda mediante Querqy
- Cómo construir un modelo de sinónimos inteligente
- La importancia de los sinónimos en la búsqueda de comercio electrónico
Palabras vacías
- ¿Importan las consultas de palabras vacías?
Sugerencias
Sinónimos: autocompletar, buscar mientras escribes, sugerencias
- Giovanni Fernández-Kincade. Bootstrapping Autosuggest, Creación de un corpus de Autosuggest, Parte 1, Creación de un corpus de Autosuggest, Parte 2, Estructuras de datos y algoritmos de recuperación de Autosuggest, Clasificación de Autosuggest
- Sobre dos tipos de sugerencias
- Mejora de las sugerencias de búsqueda para el comercio electrónico
- Mejores prácticas de búsqueda de autocompletar para aumentar las conversiones
- Por qué hemos desarrollado el módulo searchhub smartSuggest y por qué podría ser importante para usted
- Nielsen Norman Group: sugerencias de búsqueda de sitios
- 13 patrones de diseño para sugerencias de autocompletar
- Autocompletar
- Autocompletar y experiencia de usuario
- IMPLEMENTAR UNA BÚSQUEDA COMO LINKEDIN MIENTRAS ESCRIBE CON ELASTICSEARCH
- Mejores prácticas de autocompletar inteligente: mejore la relevancia de la búsqueda y las ventas
- OLX: Creación de corpus para AutoSuggest (Parte 1), Recuperación y clasificación de AutoSuggest (Parte 2)
- Autocompletar, sugerencias de búsqueda en vivo y autocorrección: patrones de diseño de mejores prácticas
- Espejito, espejito, ¿qué escribo a continuación? Todo sobre las sugerencias de búsqueda
- Cómo construimos la rápida sugerencia automática para otto.de
Gráficos/Taxonomías/Gráfico de conocimiento
Gráficos de conocimiento aplicados en la industria minorista.
Los gráficos de conocimiento se están volviendo cada vez más populares en tecnología. Exploramos cómo se pueden utilizar en la industria minorista para enriquecer los datos, ampliar los resultados de búsqueda y agregar valor a una empresa minorista.
Impresionantes gráficos de conocimiento
Integración de gráficos de conocimiento y búsqueda (por Enterprise Knowledge)
- Parte 1: Mostrar relaciones
- Ampliación de consultas de búsqueda con incrustaciones de consultas
Expansión de consultas
- Fundamentos de la reescritura de consultas (parte 1): introducción a la expansión de consultas
Comprensión de consultas
- Comprensión de consultas de Daniel Tunkelang.
- Comprensión de consultas, dividida en tres partes
- Busque cosas, no cadenas
- Comprender la consulta de búsqueda. Parte 1, Parte 2, Parte 3
- Descubrimiento de alimentos con Uber Eats: creación de un motor de comprensión de consultas
- IA para la comprensión de consultas
Intención de búsqueda
- Asignación de consultas de búsqueda a intenciones de búsqueda
- Búsqueda: intención, no inventario
Segmentación de consultas
- Segmentación de consultas no supervisadas en papel utilizando únicamente registros de consultas
- Documento hacia la segmentación de consultas semánticas
Algoritmos
BERT
- Comprender BERT y la relevancia de la búsqueda
- Google está mejorando la búsqueda web con BERT: ¿podemos usarlo también para la búsqueda empresarial?
COLBERT
- Modelos de lenguaje Transformer previamente entrenados para búsqueda - parte 3
Colocaciones, frases comunes.
- Detecta automáticamente frases comunes (expresiones de varias palabras/n-gramas de palabras) a partir de un flujo de oraciones.
- La eficacia irrazonable de las colocaciones
Otros algoritmos
- Una codificación en caliente
- Escribir un motor de búsqueda de texto completo usando filtros Bloom
hash
- Hash sensible a la localidad
- Hashing sensible a la localidad (LSH): la guía práctica e ilustrada
- Minhash
Ordenar por calificaciones promedio
- Mejor que el promedio: ordenar por mejor calificación
- Cómo no ordenar por calificación promedio
Extracción de palabras clave
- Extracción de palabras clave usando RAKE
- Otro extractor de palabras clave más (Yake)
- Extracción de palabras clave con BERT
Seguimiento, elaboración de perfiles, RGPD, Análisis
Herramientas, plataformas y ayudantes para el seguimiento de búsquedas.
- Información sobre el comportamiento del usuario de OpenSearch
- Seguimiento de búsqueda del sitio con Google Analytics 4
- Quitanieves
- recopilador de búsqueda
- OpenTelemetry con adiciones de búsqueda
- Análisis de consultas de pulso
- Seguimiento de quién está atractivo y quién no presenta un desafío algorítmico
Recursos
- Anonimización: gestión del riesgo de protección de datos (código de práctica)
- El marco de toma de decisiones de anonimización
- 98 puntos de datos personales que Facebook utiliza para orientarle anuncios
- Análisis de oportunidades para la búsqueda
- Una cara está expuesta para AOL Searcher No. 4417749
- Fuga de datos de búsqueda de AOL
- Datos personales
experimentos
- Errores comunes de la experimentación en búsquedas
- Mejorar Search @scale con experimentación de consultas eficiente
Pruebas A/B, MAB
- Las pruebas A/B para la búsqueda son diferentes
- Búsqueda de pruebas A/B: pensar como un científico
Pruebas, métricas, KPI
Métrica
- Ganancia acumulada descontada
- Sabores de NDCG: ¿normalizados a qué?
- Rango recíproco medio
- Paquete
- Desmitificando nDCG y ERR
- Elegir su métrica de evaluación de relevancia de búsqueda
- Cómo implementar un goleador de calidad de clasificación de ganancia acumulada descontada normalizada (NDCG) en Quepid
- https://en.wikipedia.org/wiki/Precision_and_recall
- https://en.wikipedia.org/wiki/F1_score
- Visualización de métricas de búsqueda
- Elegir su métrica de evaluación de relevancia de búsqueda
- Calcule el rango recíproco medio (MRR) utilizando Pandas
- Sistemas de recomendación: métricas de aprendizaje automático y métricas comerciales
KPI
- Cinco formas correctas de medir el rendimiento de la búsqueda
- KPI de búsqueda de sitios de comercio electrónico. Parte 1 – Clientes, Parte 2 – Productos, Parte 3 – Consultas
- Aprender de la fricción para mejorar la experiencia de búsqueda
- Detrás de la magia de una experiencia de búsqueda perfecta
- Análisis de métricas de relevancia de búsqueda en línea con Elastic Stack
- Cómo obtener información de los análisis de búsqueda
Evaluación de la búsqueda (por Daniel Tunkelang)
- Mídelo
- Medición del comportamiento del buscador
- Usando el juicio humano
- Cuando no hay tasa de conversión
Medición de la búsqueda (por James Rubinstein)
- Enfoques estadísticos y centrados en el ser humano para la mejora de los motores de búsqueda
- Un enfoque humano
- Establecer un programa de evaluación de relevancia
- Las métricas importan
- Búsqueda de pruebas A/B: pensar como un científico
- Clasificación de consultas: el arma secreta para la relevancia de la búsqueda
- La revisión del lanzamiento: reuniéndolo todo...
Tres pilares de la relevancia de la búsqueda (por Andreas Wagner)
- Parte 1: Encontrabilidad
- Parte 2: Calidad de búsqueda para descubrimiento e inspiración
Arquitectura
- El arte de la abstracción: revisando la arquitectura de la tienda web
- Canva - Canal de búsqueda
- Primera parte: resumen de los desafíos enfrentados
- Segunda parte nueva arquitectura de búsqueda
- Arquitectura basada en eventos para una indexación de búsqueda eficiente
Educación y networking
Conferencias
- Activar
- Palabra de moda en Berlín
- Almiar
- Elástico{ON}
- BÚSQUEDA DE COMERCIO ELECTRÓNICO MIX-CAMP
- Comercio electrónico SIGIR
Capacitaciones y cursos
Búsqueda impulsada por aprendizaje automático. Doug Turnbull Siguiente: 24 de enero de 2023
Conexiones de código abierto
- Elasticsearch "Piense como un ingeniero de relevancia"
- Solr "Piense como un ingeniero de relevancia"
- Más allá de la relevancia de la búsqueda: comprender y medir la calidad de los resultados de la búsqueda
- Hola LTR
Los entrenamientos de Sease.
Fundamentos de búsqueda. Daniel Tunkelang, Grant Ingersoll Próximo: 6 de febrero de 2023
Búsqueda con aprendizaje automático. Daniel Tunkelang, Grant Ingersoll Próximo: 27 de febrero de 2023
Búsqueda de gerentes de producto. Daniel Tunkelang Siguiente: 3 de abril de 2023
Capacitaciones en Solr, Elasticsearch y OpenSearch de Sematext
Otoño 2023
https://dtunkelang.medium.com/upcoming-search-classes-this-fall-58f877fe00ad
Libros
- Búsqueda impulsada por IA
- Búsqueda relevante
- Aprendizaje profundo para búsqueda
- Interacciones con sistemas de búsqueda
- Incorporaciones en el procesamiento del lenguaje natural. Teoría y avances en la representación vectorial del significado.
- Buscar interfaces de usuario
- Patrones de búsqueda
- Análisis de búsqueda para su sitio: conversaciones con sus clientes
- Haga clic en Modelos para búsqueda web
- Algoritmos de optimización
Blogs y Portales
Papeles
Gestión, equipo de búsqueda
- La búsqueda es un deporte de equipo
- Reflexiones sobre la gestión de equipos de búsqueda
- Sobre el liderazgo en búsqueda
- Crear un equipo de búsqueda eficaz: la clave para una búsqueda y una relevancia excelentes
- Clasificación de consultas: el arma secreta para la relevancia de la búsqueda
- La revisión del lanzamiento: reuniéndolo todo
- El papel de los propietarios de productos de búsqueda
- Gestión de productos de búsqueda: ¿la función más incomprendida en la búsqueda?
- Relevancia de búsqueda para equipos con poco personal
Entrevistas de Trabajo
- Preguntas de la entrevista para ingenieros de relevancia de búsqueda, científicos de datos y gerentes de productos
- Entrevistas sobre ciencia de datos: clasificación y búsqueda
Ingeniería
- Deuda técnica en búsqueda
Serie de publicaciones de blog
Optimización de búsqueda 101 (por Charlie Hull)
- ¿Cómo sé que mi búsqueda no funciona?
- ¿Qué significa si mi búsqueda está "rota"?
- ¿Cómo se arregla una búsqueda rota?
- Reducir el riesgo empresarial optimizando la búsqueda
Comprensión de consultas (por Daniel Tunkelang)
Mejor búsqueda a través de la comprensión de consultas.
- Una introducción
- Identificación del idioma
- Filtrado de personajes
- Tokenización
- Corrección ortográfica
- Derivación y lematización
- Reescritura de consultas: descripción general
- Expansión de consultas
- Relajación de consultas
- Segmentación de consultas
- Alcance de la consulta
- Reconocimiento de entidades
- Taxonomías y Ontologías
- Autocompletar
- Autocompletar y experiencia de usuario
- Comprensión de consultas contextuales: descripción general
- Contexto de la sesión
- Ubicación como contexto
- Estacionalidad
- Personalización
- Buscar como una conversación
- Diálogos de aclaración
- Comentarios de relevancia
- Búsqueda facetada
- Presentación de resultados de búsqueda
- Fragmentos de resultados de búsqueda
- Agrupación de resultados de búsqueda
- Respuesta a preguntas
- Comprensión de consultas e interfaces de voz
- Comprensión de consultas y chatbots
Dinámica de la red
- No es el motor de búsqueda de tu padre: una breve historia de la búsqueda minorista
- Búsqueda de vectores semánticos: la nueva frontera en el descubrimiento de productos
- Impulsar el descubrimiento de productos con la búsqueda semántica
- Plano de análisis de consultas semánticas
Considerando la búsqueda: temas de búsqueda (por Derek Sisson)
- Introducción
- Suposiciones sobre la búsqueda
- Supuestos sobre el comportamiento de búsqueda del usuario
- Tipos de recopilaciones de información
- Una mirada estructural a la búsqueda
- Los usuarios y la tarea de recuperación de información
- Búsqueda de prueba
- Referencias y enlaces de búsqueda útiles
Actores de la industria
Personalidades e influencers
- Daniel Tunkelang (él es el Dios de la Búsqueda)
- Max Irvin
- David Turnbull
- Instituto Baymard
Motores de búsqueda
- Google
- Bing
- yandex
- Amazonas
- eBay
Productos y servicios
- Algolia
- Vespa
- Elasticsearch: motor de análisis y búsqueda distribuida
- Solr: Solr es la plataforma de búsqueda multimodal, de código abierto y ultrarrápida construida sobre el vector de texto completo y las capacidades de búsqueda geoespacial de Apache Lucene.
- Servidor de búsqueda empresarial Fess
- Typesense: una alternativa de código abierto a Algolia.
- BuscarHub.io
- Datafari: una solución de búsqueda empresarial de código abierto.
- Qdrant: una base de datos vectorial de código abierto.
- Awakari: búsqueda en tiempo real desde fuentes ilimitadas como RSS, Fediverse, Telegram. Condiciones de coincidencia de palabras clave de texto, condiciones numéricas, grupos de condiciones. Basado en índice de búsqueda inversa.
- Meilisearch: API de búsqueda de código abierto que admite búsqueda de texto completo, vectorial, geoespacial y facetada
Empresas consultoras
- Tienda de BigData
- Conexiones de código abierto
- https://sease.io/
- Sematexto
Estudios de caso
- Airbnb: ranking de búsqueda de experiencias de Airbnb basado en aprendizaje automático
- Airbnb: inclusión de listados en el ranking de búsqueda
- Algolia: la arquitectura de la red de búsqueda distribuida de Algolia
- Meituan: exploración y práctica de BERT en el ranking principal de búsqueda de Meituan (?? BERT在美团搜索核心排序的探索和实践)
- Netflix: cómo la ingeniería de contenido de Netflix hace que se puedan realizar búsquedas en un gráfico federado (Parte 1, Parte 2)
- Netflix: estrategia de indexación de Elasticsearch en la plataforma de gestión de activos (AMP)
- Skyscanner - Aprender a clasificar para la búsqueda de itinerarios de vuelos
- Slack - Buscar en Slack
- Twitter: estabilidad y escalabilidad para la búsqueda
- Explicación del SEO de Amazon: cómo clasificar sus productos en el puesto número 1 en los resultados de búsqueda de Amazon en 2020
- Creación de un mejor motor de búsqueda para académicos semánticos
búsqueda general
- Cómo clasifica Bing los resultados de búsqueda: algoritmo central y enlaces azules
- Cómo funciona el ranking de búsqueda de Google: darwinismo en la búsqueda
Comercio electrónico
Mercados multilaterales
- Descubra cómo funciona y clasifica Cassini (el motor de búsqueda de eBay)
Vídeos
Consejos breves sobre Apache Solr
Canales
- Pensamientos lúcidos
- Lucidworks
- Búsqueda de comercio electrónico MIx-Camp
- Conexiones de código abierto
- SIGIR eCom
Presentado
Conjuntos de datos
- Conjunto de datos de consultas de compras: un punto de referencia de ESCI a gran escala para mejorar la búsqueda de productos
- ESCI-S: metadatos extendidos para el conjunto de datos de Amazon ESCI
- Relevancia de la búsqueda de productos de Home Depot
- WANDS - Conjunto de datos de anotación Wayfair
Herramientas
Espacioso
Awesome Spacy: comprensión del lenguaje natural, enriquecimiento de contenido, etc.
Palabra2Vec
- Word2Vec para frases: aprendizaje de incrustaciones para más de una palabra
- Tutorial de Word2Vec de Gensim
- Cómo incorporar frases en Word2Vec: un enfoque de minería de texto
- Word2Vec: un pequeño paso en el aprendizaje profundo, pero un gran salto hacia el procesamiento del lenguaje natural
- Cómo desarrollar incrustaciones de Word en Python con Gensim
bibliotecas
- Segmentador de consultas
- https://github.com/zentity-io/zentity
- https://github.com/mammothb/symspellpy
- https://github.com/searchhub/search-collector
- Kiri: búsqueda semántica de última generación simplificada.
- Haystack: marco Python de un extremo a otro para crear interfaces de búsqueda de datos en lenguaje natural.
- https://github.com/castorini/docTTTTTquery
Otro
- Coro, Smui, Querqy
- Quepido
- Evaluador de clasificación calificado
- Jina AI: un marco de búsqueda neuronal
Otras cosas increíbles
- Impresionantes gráficos de conocimiento
- Impresionante serie de tiempo
- Impresionante espacio
- Comprensión de consultas
- Haga clic en modelos