Pesquisa incrível
Apoie a luta ucraniana pela liberdade
NAVIO DE GUERRA RUSSO, VAI SE FODER
Venho construindo aplicativos de pesquisa de comércio eletrônico há quase dez anos. Abaixo você encontra uma lista de (algumas) publicações, conferências e livros que me inspiram. Agrupado por tópico (se um artigo se enquadrar em vários tópicos, ele será dividido em várias seções).
Marque-nos no GitHub - isso ajuda!
Verifique também minhas outras coleções de comércio eletrônico incrível, gráficos de conhecimento incríveis, aplicativos em nuvem incríveis
Tópicos
- Geral, diversão, filosofia
- Tipos de pesquisa
- Pesquisa clássica/lexical
- Vetores/pesquisa semântica
- Incorporações
- Tipos de vetores
- Vetores densos
- Vetores esparsos
- Modelos de codificador
- Arquiteturas principais
- Interação de tokens de consulta/documento
- Sem interações - Duas torres/Bi-codificadores
- Interações iniciais - codificadores cruzados
- Interações tardias - ColBERT
- Lidando com incorporações de alta dimensão
- Redução de dimensionalidade
- Quantização
- Quantização escalar
- Quantização binária
- Pesquisa semântica simétrica e assimétrica
- Pesquisa híbrida
- Fusão de classificação recíproca - RRF
- Pesquisa multimodal
- Áreas de aplicação
- Pesquisa empresarial
- Pesquisa de comércio eletrônico
- Pesquisa conversacional
- Pesquisa Geoespacial
- Pesquisa médica e de saúde
- Mídia social e pesquisa de conteúdo gerado pelo usuário
- Sistemas de resposta a perguntas
- Gerenciamento de informações pessoais
- Resultados da pesquisa
- Recuperação
- Classificação
- Classificação em vários estágios
- Aprendendo a classificar
- Clique nos modelos para pesquisar
- Viés
- Diversificação
- Personalização
- Zero resultados de pesquisa
- Pesquisar experiência do usuário
- Instituto Baymard
- Grupo Nielsen Norman
- Conhecimento Empresarial LLC
- Facetas
- Outro
- Correção ortográfica
- Sugestões
- Sinônimos
- Palavras irrelevantes
- Gráficos/Taxonomias/Gráfico de Conhecimento
- Integrando gráficos de pesquisa e conhecimento (por Enterprise Knowledge)
- Expansão de consulta
- Compreensão da consulta
- Intenção de pesquisa
- Segmentação de consulta
- Algoritmos
- BERTO
- ColBERT
- Colocações, frases comuns
- Outros algoritmos
- Rastreamento, criação de perfil, GDPR, análise
- Experimentos
- Avaliando a pesquisa
- MRR
- Testes, métricas, KPIs
- Avaliando a pesquisa (por Daniel Tunkelang)
- Medindo a pesquisa (por James Rubinstein)
- Três pilares da relevância da pesquisa (por Andreas Wagner)
- Arquitetura
- Pesquisa de vetores
- Educação e networking
- Conferências
- Treinamentos e cursos
- Livros
- Blogs e Portais, Notícias
- Artigos
- Gestão, Equipe de Pesquisa
- Entrevistas de emprego
- Engenharia
- Jogadores da indústria
- Personalidades e influenciadores
- Mecanismos de busca
- Produtos e serviços
- Empresas de consultoria
- Série de postagens de blog
- Otimização de pesquisa 101 (por Charlie Hull)
- Compreensão da consulta (por Daniel Tunkelang)
- Dinâmica de Grade
- Considerando a pesquisa: tópicos de pesquisa (por Derek Sisson)
- Vídeos
- Estudos de caso
- Pesquisa geral
- Mercados multilaterais
- Comércio eletrônico
- Conjuntos de dados
- Ferramentas
Não classificado
- caixa de areia, junho de 2021
- caixa de areia maio de 2021
- caixa de areia abril de 2021
- caixa de areia, dezembro de 2020
- caixa de areia janeiro de 2020
Geral, diversão, filosofia
- Falsidades que os programadores acreditam sobre a pesquisa
- Pesquisa Ética: Projetando uma jornada irresistível e com impacto positivo
- Na pesquisa semântica
- Dívida de feedback: o que o segway ensina às equipes de busca
- Apoiando a jornada do pesquisador: quando e como
- Comprar é difícil, vamos pesquisar!
- Uma introdução à qualidade da pesquisa
- Padrões de design de pesquisa no site para comércio eletrônico: estrutura de esquema, classificação baseada em dados e muito mais
- Em busca do recall
- Equilibre seu orçamento de pesquisa!
Tipos de pesquisa
- Evolução da tecnologia de pesquisa: um olhar para o futuro
Pesquisa Clássica/Lexical
- Etsy. Direcionando consultas amplas na pesquisa
- Como o Etsy usa a termodinâmica para ajudá-lo a pesquisar “Geeky”
- Consultas de pesquisa amplas e ambíguas
- Desconstruindo a pesquisa de comércio eletrônico: os 12 tipos de consulta
Vetores/pesquisa semântica
Migrando para o Elasticsearch com vetor denso para o mecanismo de busca Carousell Spotlight
Do zero ao modelo de incorporação de pesquisa semântica
Diretrizes para escolher um índice
Série Pinha
- Índices de vizinhos mais próximos para pesquisa de similaridade
- A cláusula WHERE ausente na pesquisa vetorial
Experiência de pesquisa inovadora com Amazon OpenSearch e Amazon Bedrock
Pesquisa semântica simétrica e assimétrica
- Pesquisa semântica simétrica vs. assimétrica
Incorporações
Tipos
- Bi-codificador vs codificador cruzado? Quando usar qual?
- O que é ColBERT e interação tardia e por que são importantes na pesquisa?
Modelos de codificador
- Escolhendo o melhor modelo para pesquisa semântica
Interação de tokens de consulta/documento
Sem interações - Duas torres/Bi-codificadores
Interações iniciais - codificadores cruzados
Interações tardias - ColBERT
- Anunciando o incorporador Vespa ColBERT
- O que é ColBERT e interação tardia e por que são importantes na pesquisa?
Vetores densos
Incorporações Matryoshka
- Embeddings Matryoshka: pesquisa vetorial OpenAI mais rápida usando Adaptive Retrieval
- Introdução aos modelos de incorporação Matryoshka
- Representações Matryoshka. Um guia para pesquisa semântica mais rápida
Vetores esparsos
ESPADA
- Pesquisa híbrida: SPLADE (codificador esparso)
- SPLADE para pesquisa de vetores esparsos explicada
Lidando com incorporações de alta dimensão
Redução de dimensionalidade
Quantização
Incorporações binárias
Pesquisa híbrida
- Pesquisa híbrida> soma de suas partes?
- Na pesquisa híbrida
- Pesquisa híbrida com reclassificação
Fusão de classificação recíproca (RRF)
- Pesquisa híbrida com reclassificação
- Fusão de classificação recíproca
Pesquisa multimodal
- Muves: pesquisa vetorial multimodal e multilíngue com aceleração de hardware
- Seleção de modelo para pesquisa multimodal
Áreas de aplicação
Pesquisa empresarial
- GenAI pode melhorar a pesquisa empresarial, mas continua sendo um trabalho em andamento
Pesquisa de comércio eletrônico
- A influência dos algoritmos TF-IDF na pesquisa de comércio eletrônico
Pesquisa conversacional
- Pesquisar como uma conversa
- Recursos para pesquisa conversacional
- Compreensão de consultas e chatbots
Resultados da pesquisa
Recuperação
Relevância
- Os humanos procuram coisas, não cordas
- O que é um resultado de pesquisa 'relevante'?
- Como alcançar relevância na pesquisa de comércio eletrônico
- Configurando um programa de avaliação de relevância
Algoritmos de Relevância
- Compreendendo o algoritmo de pesquisa de texto completo BM25
- BM25 prático: como os fragmentos afetam a pontuação de relevância no Elasticsearch, o algoritmo BM25 e suas variáveis
- A influência dos algoritmos TF-IDF na pesquisa de comércio eletrônico
- BM25 A Próxima Geração de Relevância Lucene
- Semelhanças Lucene (BM25, DFR, DFI, IB, LM) explicadas
Classificação
Classificação em vários estágios
- Classificação em vários estágios
Aprendendo a classificar
- Como a pesquisa é diferente de outros problemas de aprendizado de máquina?
- Classificação de pesquisa assistida por aprendizado de reforço
- Reclassificação da pesquisa de comércio eletrônico como um problema de aprendizagem por reforço
- Quando usar um classificador de pesquisa aprendido por máquina versus um classificador de pesquisa baseado em pontuação
- O que é aprender a classificar?
- Usando IA e aprendizado de máquina para superar preconceitos de posição no Adobe Stock Search
- Conjuntos de treinamento e teste divididos para avaliar o aprendizado para classificar modelos
- Como funciona o LambdaMART – otimizando as metas de classificação de produtos
Clique nos modelos para pesquisar
- Clique em modelos
- Clique em Modelagem para comércio eletrônico
- Usando dados comportamentais para melhorar a pesquisa
Viés
- O que é preconceito de apresentação na pesquisa?
- Lidando com preconceitos de posição em recomendações e pesquisas
Diversificação
- Diversificação de resultados de pesquisa usando modelos de linguagem causal
- Aprendendo a diversificar a pesquisa de comércio eletrônico com o Multi-Armed Bandit
- Qualidade de pesquisa para descoberta e inspiração
- Como medir a diversidade dos resultados da pesquisa
- Procurando Cachinhos Dourados
- Consultas de pesquisa amplas e ambíguas – reconhecendo quando os resultados da pesquisa precisam de diversificação
- Reflexões sobre a diversidade dos resultados de pesquisa
Personalização
- Padrões para personalização em recomendações e pesquisa
- Daniel Tunkelang Personalização
- Airbnb – Personalização em tempo real na pesquisa
- 98 pontos de dados pessoais que o Facebook usa para direcionar anúncios para você
- Arquitetura de sistemas de recomendação do mundo real
- Engenharia de recursos para pesquisa personalizada
Zero resultados de pesquisa
- Estratégias para usar consultas alternativas para mitigar resultados zero e sua aplicação em mercados online
- Equivalência Semântica de Consultas de Comércio Eletrônico
Pesquisar experiência do usuário
Instituto Baymard
- Desconstruindo a pesquisa de comércio eletrônico: os 12 tipos de consulta
- Direcionar automaticamente ou orientar os usuários para a categoria correspondente
- 13 padrões de design para sugestões de preenchimento automático (27% erraram)
- A pesquisa de comércio eletrônico precisa oferecer suporte às consultas de pesquisa não relacionadas a produtos dos usuários (15% não o fazem)
- UX de pesquisa: 6 elementos essenciais para páginas 'sem resultados'
- As miniaturas dos produtos devem ser atualizadas dinamicamente para corresponder à variação pesquisada (54% não o fazem)
- Classificação facetada – um novo método para classificar resultados de pesquisa
- O estado atual da pesquisa de comércio eletrônico
- Os sites de comércio eletrônico precisam de vários desses cinco recursos de 'escopo de pesquisa'
- Design de campo de pesquisa de comércio eletrônico e suas implicações
- Sites de comércio eletrônico devem incluir snippets de pesquisa contextual (96% entendem errado)
- Usabilidade de pesquisa de comércio eletrônico: relatório e benchmark
- Seis melhorias de UX relacionadas ao comércio eletrônico 'COVID-19' a serem feitas
Grupo Nielsen Norman
- O padrão de olhar do amor à primeira vista nas páginas de resultados de pesquisa
- Bom abandono nas páginas de resultados de pesquisa
- Páginas complexas de resultados de pesquisa alteram o comportamento de pesquisa: o padrão Pinball
- Sugestões de pesquisa de sites
- Análise de log de pesquisa: a oportunidade mais negligenciada na pesquisa de experiência do usuário na Web
- Pesquisa com escopo: perigosa, mas às vezes útil
- 3 diretrizes para páginas "sem resultados" em mecanismos de pesquisa
Conhecimento Empresarial LLC
- Otimizando sua experiência de pesquisa: uma abordagem centrada no ser humano para o design de pesquisa
Facetas
- Facetas da pesquisa facetada
- Café, Café, Café!
- Pesquisa facetada (comece aqui!)
- Como implementar a pesquisa facetada da maneira certa
- Metadados e pesquisa facetada
- Metacrap: Acendendo sete espantalhos da meta-utopia
- 7 implementações de filtragem que tornam a Macy's a melhor da categoria
- Pesquisa facetada: o guia mais abrangente. Melhores práticas, padrões de design, advertências ocultas e soluções alternativas
- Facetas: restrições ou preferências?
- Facetas, mas quais?
Taxonomista Acidental
- Quantas facetas uma taxonomia deve ter
- Quando uma taxonomia não deve ser hierárquica
- Personalização de facetas de taxonomia
Outro
- Aprendendo com o atrito para melhorar a experiência de pesquisa
- Por que é tão difícil classificar por preço?
- Classificação facetada
- Google mata a Pesquisa Instantânea
Correção ortográfica
- Pedro Norvig. "Como escrever um corretor ortográfico". Publicação clássica.
- Daniel Tunkelang. "Correção ortográfica"
- Um corretor ortográfico simples criado a partir de vetores de palavras
- Uma análise mais detalhada do problema de correção ortográfica: 1, 2, 3, preDict
- Ortografia Profunda
- Modelagem de correção ortográfica para pesquisa no Etsy
- Lobo Garbe. Autor de Sympell. Algoritmo de correção ortográfica 1000x mais rápido, destaque principal SymSpell vs. BK-tree: pesquisa de string difusa e verificação ortográfica 100x mais rápida, segmentação rápida de palavras de texto barulhento
- Chars2vec: modelo de linguagem baseado em caracteres para lidar com textos do mundo real com erros ortográficos e
- JamSpell, correção ortográfica levando em consideração o contexto circundante - biblioteca, (em russo) Исправляем опечатки с учётом контекста
- Incorporação para correção ortográfica
- Um corretor ortográfico simples criado a partir de vetores de palavras
- Quais são alguns algoritmos de correção ortográfica usados pelos mecanismos de pesquisa?
- Moman - lucene/solr/elasticsearch correção ortográfica/autocorreção é (era?) Na verdade, alimentado por esta biblioteca.
- Segmentação de consulta e correção ortográfica
- Aplicando verificação ortográfica baseada no contexto no Spark NLP
- Autocorreção no Google, Amazon e Pinterest e como escrever a sua própria
Sinônimos
- Aumentando o poder do Elasticsearch com sinônimos
- Conversa real sobre sinônimos e pesquisa
- Sinônimos em Solr I - O bom, o mau e o feio
- Sinônimos e antônimos do WordNet
- Sinônimos e antônimos em Python
- Mergulhe no WordNet com NLTK
- Criando pesquisas melhores por meio da detecção automática de sinônimos
- Sinônimos multipalavras na pesquisa usando Querqy
- Como construir um modelo de sinônimos inteligentes
- A importância dos sinônimos na pesquisa de comércio eletrônico
Palavras irrelevantes
- As consultas com todas as palavras irrelevantes são importantes?
Sugestões
Sinônimos: preenchimento automático, pesquisa enquanto você digita, sugestões
- Giovanni Fernández-Kincade. Inicializando o Autosuggest, Construindo um Corpus de Autosuggest, Parte 1, Construindo um Corpus de Autosuggest, Parte 2, Estruturas e Algoritmos de Dados de Recuperação de Autosuggest, Classificação de Autosuggest
- Sobre dois tipos de sugestões
- Melhorando as sugestões de pesquisa para comércio eletrônico
- Práticas recomendadas de pesquisa de preenchimento automático para aumentar as conversões
- Por que desenvolvemos o módulo searchhub smartSuggest e por que ele pode ser importante para você
- Nielsen Norman Group: sugestões de pesquisa de sites
- 13 padrões de design para sugestões de preenchimento automático
- Preenchimento automático
- Preenchimento automático e experiência do usuário
- IMPLEMENTANDO UMA PESQUISA COMO LINKEDIN ENQUANTO VOCÊ DIGITA COM ELASTICSEARCH
- Práticas recomendadas de preenchimento automático inteligente: melhore a relevância da pesquisa e as vendas
- OLX: Construindo Corpus para AutoSuggest (Parte 1), Recuperação e Classificação do AutoSuggest (Parte 2)
- Preenchimento automático, sugestões de pesquisa ao vivo e correção automática: padrões de design de práticas recomendadas
- Espelho, espelho, o que vou digitar a seguir? Tudo sobre sugestões de pesquisa
- Como construímos a sugestão automática extremamente rápida para otto.de
Gráficos/Taxonomias/Gráfico de Conhecimento
Gráficos de conhecimento aplicados no setor varejista
Os gráficos de conhecimento estão se tornando cada vez mais populares na tecnologia. Exploramos como eles podem ser usados no setor de varejo para enriquecer dados, ampliar resultados de pesquisa e agregar valor a uma empresa de varejo.
Gráficos de conhecimento incríveis
Integrando gráficos de pesquisa e conhecimento (por Enterprise Knowledge)
- Parte 1: Exibindo Relacionamentos
- Expansão da consulta de pesquisa com incorporações de consulta
Expansão de consulta
- Fundamentos da reescrita de consultas (parte 1): introdução à expansão de consultas
Compreensão da consulta
- Daniel Tunkelang Compreensão da consulta.
- Compreensão da consulta, dividida em três partes
- Procure coisas, não cordas
- Compreendendo a consulta de pesquisa. Parte 1, Parte 2, Parte 3
- Descoberta de alimentos com Uber Eats: construindo um mecanismo de compreensão de consultas
- IA para compreensão de consultas
Intenção de pesquisa
- Mapeando consultas de pesquisa para intenções de pesquisa
- Pesquisa: intenção, não inventário
Segmentação de consulta
- Segmentação de consulta não supervisionada em papel usando apenas logs de consulta
- Artigo sobre segmentação de consulta semântica
Algoritmos
BERTO
- Compreendendo o BERT e a relevância da pesquisa
- O Google está melhorando a pesquisa na web com o BERT – podemos usá-lo também para pesquisas corporativas?
ColBERT
- Modelos de linguagem de transformador pré-treinados para pesquisa - parte 3
Colocações, frases comuns
- Detecte automaticamente frases comuns – expressões com várias palavras/n-gramas de palavras – a partir de um fluxo de frases.
- A eficácia irracional das colocações
Outros algoritmos
- Uma codificação quente
- Escrevendo um mecanismo de pesquisa de texto completo usando filtros Bloom
Hashing
- Hashing sensível à localidade
- Hashing sensível à localidade (LSH): o guia prático e ilustrado
- Minhash
Classificando por classificações médias
- Melhor que a média: classificar pela melhor classificação
- Como não classificar por classificação média
Extração de palavras-chave
- Extração de palavras-chave usando RAKE
- Mais um extrator de palavras-chave (Yake)
- Extração de palavras-chave com BERT
Rastreamento, criação de perfil, GDPR, análise
Ferramentas, plataformas, auxiliares para rastreamento de pesquisa
- Informações sobre o comportamento do usuário do OpenSearch
- Acompanhamento de pesquisa de sites com Google Analytics 4
- Limpa-neve
- coletor de pesquisa
- OpenTelemetry com adições de pesquisa
- Análise de consulta de pulso
- Rastrear quem é atraente e quem não é apresenta um desafio algorítmico
Recursos
- Anonimização: gestão do risco de proteção de dados (código de prática)
- A Estrutura de Tomada de Decisão de Anonimização
- 98 pontos de dados pessoais que o Facebook usa para direcionar anúncios para você
- Análise de oportunidades para pesquisa
- Um rosto é exposto para o AOL Searcher nº 4417749
- Vazamento de dados de pesquisa da AOL
- Dados pessoais
Experimentos
- Armadilhas comuns da experimentação de pesquisa
- Melhorando a Pesquisa @scale com experimentação de consulta eficiente
Teste A/B, MABs
- O teste A/B para pesquisa é diferente
- Pesquisa de teste A/B: pensando como um cientista
Testes, métricas, KPIs
Métricas
- Ganho cumulativo descontado
- Sabores de NDCG – normalizados para quê!?
- Classificação recíproca média
- P@k
- Desmistificando nDCG e ERR
- Escolhendo sua métrica de avaliação de relevância de pesquisa
- Como implementar um Índice de qualidade de classificação de ganho cumulativo com desconto normalizado (NDCG) no Quepid
- https://en.wikipedia.org/wiki/Precision_and_recall
- https://en.wikipedia.org/wiki/F1_score
- Visualizando métricas de pesquisa
- Escolhendo sua métrica de avaliação de relevância de pesquisa
- Calcule a classificação média recíproca (MRR) usando Pandas
- Sistemas de recomendação: métricas de aprendizado de máquina e métricas de negócios
KPIs
- 5 maneiras certas de avaliar o desempenho da pesquisa
- KPIs de pesquisa de sites de comércio eletrônico. Parte 1 – Clientes, Parte 2 – Produtos, Parte 3 – Consultas
- Aprendendo com o atrito para melhorar a experiência de pesquisa
- Por trás da magia de uma experiência de pesquisa perfeita
- Analisando métricas de relevância de pesquisa online com o Elastic Stack
- Como obter insights do Search Analytics
Avaliando a pesquisa (por Daniel Tunkelang)
- Meça
- Medindo o comportamento do pesquisador
- Usando o julgamento humano
- Quando não há taxa de conversão
Medindo a pesquisa (por James Rubinstein)
- Abordagens estatísticas e centradas no ser humano para melhoria de mecanismos de pesquisa
- Uma abordagem humana
- Configurando um programa de avaliação de relevância
- Métricas são importantes
- Pesquisa de teste A/B: pensando como um cientista
- Triagem de consulta: a arma secreta para a relevância da pesquisa
- A revisão de lançamento: reunindo tudo…
Três pilares da relevância da pesquisa (por Andreas Wagner)
- Parte 1: Encontrabilidade
- parte 2: Qualidade de pesquisa para descoberta e inspiração
Arquitetura
- A Arte da Abstração – Revisitando a Arquitetura da Webshop
- Canva - Pipeline de pesquisa
- Parte Um esboço dos desafios enfrentados
- Parte Dois nova arquitetura de pesquisa
- Arquitetura orientada a eventos para indexação de pesquisa eficiente
Educação e networking
Conferências
- Ativar
- Palavra da moda de Berlim
- Palheiro
- Elástico{ON}
- PESQUISA DE E-COMMERCE MIX-CAMP
- Comércio eletrônico SIGIR
Treinamentos e cursos
Pesquisa baseada em aprendizado de máquina. Doug Turnbull Próximo: 24 de janeiro de 2023
Conexões de código aberto
- Elasticsearch "Pense como um engenheiro de relevância"
- Solr "Pense como um engenheiro de relevância"
- Além da relevância da pesquisa: compreendendo e medindo a qualidade dos resultados da pesquisa
- Olá LTR
Treinamentos de Sease
Fundamentos de pesquisa. Daniel Tunkelang, Grant Ingersoll Próximo: 6 de fevereiro de 2023
Pesquise com aprendizado de máquina. Daniel Tunkelang, Grant Ingersoll Próximo: 27 de fevereiro de 2023
Procure gerentes de produto. Daniel Tunkelang Próximo: 3 de abril de 2023
Treinamentos Solr, Elasticsearch e OpenSearch da Sematext
Outono de 2023
https://dtunkelang.medium.com/upcoming-search-classes-this-fall-58f877fe00ad
Livros
- Pesquisa com tecnologia de IA
- Pesquisa relevante
- Aprendizado profundo para pesquisa
- Interações com sistemas de pesquisa
- Incorporações em processamento de linguagem natural. Teoria e avanços na representação vetorial de significado
- Pesquisar interfaces de usuário
- Padrões de pesquisa
- Search Analytics para seu site: conversas com seus clientes
- Clique em Modelos para Pesquisa na Web
- Algoritmos de Otimização
Blogs e portais
Artigos
Gestão, Equipe de Pesquisa
- A pesquisa é um esporte de equipe
- Reflexões sobre o gerenciamento de equipes de pesquisa
- Liderança em pesquisa
- Construindo uma equipe de pesquisa eficaz: a chave para uma ótima pesquisa e relevância
- Triagem de consulta: a arma secreta para a relevância da pesquisa
- A revisão de lançamento: reunindo tudo
- O papel dos proprietários de produtos de pesquisa
- Gerenciamento de produtos de pesquisa: o papel mais incompreendido na pesquisa?
- Relevância da pesquisa para equipes com falta de pessoal
Entrevistas de emprego
- Perguntas de entrevista para engenheiros de relevância de pesquisa, cientistas de dados e gerentes de produto
- Entrevistas de ciência de dados: classificação e pesquisa
Engenharia
- Dívida técnica na pesquisa
Série de postagens de blog
Otimização de pesquisa 101 (por Charlie Hull)
- Como posso saber se minha pesquisa foi interrompida?
- O que significa se minha pesquisa estiver 'interrompida'?
- Como você conserta uma pesquisa quebrada?
- Reduzindo o risco comercial otimizando a pesquisa
Compreensão da consulta (por Daniel Tunkelang)
Melhor pesquisa por meio da compreensão da consulta.
- Uma introdução
- Identificação de Idioma
- Filtragem de caracteres
- Tokenização
- Correção ortográfica
- Lematização e Lematização
- Reescrita de consulta: uma visão geral
- Expansão de consulta
- Relaxamento de consulta
- Segmentação de consulta
- Escopo da consulta
- Reconhecimento de Entidade
- Taxonomias e Ontologias
- Preenchimento automático
- Preenchimento automático e experiência do usuário
- Compreensão da consulta contextual: uma visão geral
- Contexto da sessão
- Localização como Contexto
- Sazonalidade
- Personalização
- Pesquisar como uma conversa
- Diálogos de Esclarecimento
- Feedback de relevância
- Pesquisa facetada
- Apresentação dos resultados da pesquisa
- Fragmentos de resultados de pesquisa
- Agrupamento de resultados de pesquisa
- Resposta a perguntas
- Compreensão de consultas e interfaces de voz
- Compreensão de consultas e chatbots
Dinâmica de Grade
- Não é o mecanismo de pesquisa do seu pai: uma breve história da pesquisa no varejo
- Pesquisa vetorial semântica: a nova fronteira na descoberta de produtos
- Impulsionando a descoberta de produtos com pesquisa semântica
- Modelo de análise de consulta semântica
Considerando a pesquisa: tópicos de pesquisa (por Derek Sisson)
- Introdução
- Suposições sobre pesquisa
- Suposições sobre o comportamento de pesquisa do usuário
- Tipos de coletas de informações
- Uma visão estrutural da pesquisa
- Usuários e a tarefa de recuperação de informações
- Testando pesquisa
- Links e referências úteis de pesquisa
Jogadores da indústria
Personalidades e influenciadores
- Daniel Tunkelang (ele é o Deus da Pesquisa)
- Max Irwin
- Doug Turnbull
- Instituto Baymard
Mecanismos de busca
- Google
- Google
- Yandex
- Amazônia
- eBay
Produtos e serviços
- Algolia
- Vespa
- Elasticsearch – mecanismo distribuído de pesquisa e análise
- Solr - Solr é a plataforma de pesquisa multimodal extremamente rápida, de código aberto, construída no vetor de texto completo e nos recursos de pesquisa geoespacial do Apache Lucene
- Servidor de pesquisa empresarial Fess
- Typesense - uma alternativa de código aberto ao Algolia.
- SearchHub.io
- Datafari - uma solução de pesquisa empresarial de código aberto.
- Qdrant - um banco de dados vetorial de código aberto.
- Awakari - Pesquisa em tempo real de fontes ilimitadas como RSS, Fediverse, Telegram. Condições de correspondência de palavras-chave de texto, condições numéricas, grupos de condições. Baseado em índice de pesquisa reversa.
- Meilisearch – API de pesquisa de código aberto que suporta pesquisa de texto completo, vetorial, geoespacial e facetada
Empresas de consultoria
- Big Data Boutique
- Conexões de código aberto
- https://sease.io/
- Semtexto
Estudos de caso
- Airbnb - Classificação de pesquisa de experiências do Airbnb baseada em aprendizado de máquina
- Airbnb - Listagem de incorporações na classificação de pesquisa
- Algolia - A arquitetura da rede de pesquisa distribuída da Algolia
- Meituan - Exploração e prática de BERT na classificação principal da pesquisa Meituan (?? BERT在美团搜索核心排序的探索和实践)
- Netflix - Como a Engenharia de Conteúdo da Netflix torna um gráfico federado pesquisável (Parte 1, Parte 2)
- Netflix - Estratégia de indexação Elasticsearch em plataforma de gerenciamento de ativos (AMP)
- Skyscanner - Aprendendo a classificar para pesquisa de itinerário de voo
- Slack - Pesquise no Slack
- Twitter – Estabilidade e escalabilidade para pesquisa
- Amazon SEO explicado: como classificar seus produtos em primeiro lugar nos resultados de pesquisa da Amazon em 2020
- Construindo um mecanismo de pesquisa melhor para estudiosos semânticos
Pesquisa geral
- Como o Bing classifica os resultados da pesquisa: algoritmo principal e links azuis
- Como funciona a classificação de pesquisa do Google – Darwinismo na pesquisa
Comércio eletrônico
Mercados multilaterais
- Descubra como funciona e classifica Cassini (o mecanismo de pesquisa do eBay)
Vídeos
Dicas curtas do Apache Solr
Canais
- Pensamentos Lúcidos
- Lucid Works
- Pesquisa de comércio eletrônico MIx-Camp
- Conexões de código aberto
- SIGIR eCom
Apresentou
Conjuntos de dados
- Conjunto de dados de consultas de compras: um benchmark ESCI em grande escala para melhorar a pesquisa de produtos
- ESCI-S: metadados estendidos para conjunto de dados Amazon ESCI
- Relevância da pesquisa de produtos da Home Depot
- WANDS - Conjunto de dados de anotação Wayfair
Ferramentas
Espaçoso
Awesome Spacy - Compreensão da linguagem natural, enriquecimento de conteúdo, etc.
Word2Vec
- Word2Vec para frases – Aprendendo incorporações para mais de uma palavra
- Tutorial Gensim Word2Vec
- Como incorporar frases no Word2Vec – uma abordagem de mineração de texto
- Word2Vec – um pequeno passo no Deep Learning, mas um salto gigante em direção ao Processamento de Linguagem Natural
- Como desenvolver incorporações de palavras em Python com Gensim
Bibliotecas
- Segmentador de consulta
- https://github.com/zentity-io/zentity
- https://github.com/mammothb/symspellpy
- https://github.com/searchhub/search-collector
- Kiri – Pesquisa semântica de última geração facilitada.
- Haystack – Estrutura Python ponta a ponta para construção de interfaces de pesquisa em linguagem natural para dados.
- https://github.com/castorini/docTTTTTquery
Outro
- Refrão, Smui, Querqy
- Quepido
- Avaliador de classificação avaliado
- Jina AI – Uma estrutura de pesquisa neural
Outras coisas incríveis
- Gráficos de conhecimento incríveis
- Série temporal incrível
- Impressionante Espaçoso
- Compreensão da consulta
- Clique em modelos