Download elasticsearch_tutorial - download do código-fonte elasticsearch

elasticsearch_tutorial

Outro código-fonte

1.0.0

Baixar

Isenção de responsabilidade

Este tutorial foi criado para o ElasticSearch versão 5.2. A versão 5 apresenta várias alterações importantes em termos de DSL de consulta e mapeamento.

Se você ainda estiver executando a versão 2.x, dê uma olhada na ramificação v2 deste repositório .

Exemplos de ElasticSearch

Alinhei vários exemplos para mostrar os recursos e o poder do ElasticSearch. Muitas informações são baseadas em "ElasticSearch, The Definitive Guide".

Instalando

Baixe ElasticSearch e Kibana aqui e siga estas etapas simples:

Instale o ElasticSearch e o Kibana.
Execute ElasticSearch ./bin/elasticsearch
Execute ./bin/kibana
Use o console Kibana acessando http://localhost:5601/app/kibana#/dev_tools/console

Exercício 1: o básico

O Exercício 1 é muito simples e o objetivo é pegar o jeito da interface RESTFul do ElasticSearch.

Tópicos:

Navegando até a página inicial do ElasticSearch
Pesquisando todos os documentos
Contando documentos
Adicionando documentos ao índice
Atualizações completas de documentos
Atualizações parciais de documentos
Recuperar documentos individuais
Pesquisando todos os documentos para um índice específico

Exercício de carga 1

Exercício 2: carregar dados em massa

No exercício 2 estaremos indexando muitos dados. Para melhorar o desempenho, estamos fazendo isso em massa.

Esses dados contêm informações do blog Combell. Indexei as seguintes informações:

Título
Autor
Data
Categorias
Linguagem
GUIA

Esses dados serão utilizados nos demais exercícios.

Carregue os dados do blog em massa

Exercício 3: pesquisa, conhecendo a consulta DSL

No exercício 3, estamos realizando algumas consultas básicas usando a DSL de consulta ElasticSearch. A DSL é baseada em JSON e as consultas são pesquisas de texto completo.

Aqui estão algumas pesquisas que estamos realizando:

Pesquise um único termo em um índice
Pesquise vários termos em um índice
Realize pesquisas em vários termos usando o operador "e"
Defina o número mínimo de correspondências que um documento deve ter
Defina a proximidade dos termos que você está pesquisando

Exercício de carga 3

Exercício 4: análise

No exercício 4, vamos nos concentrar na análise do texto completo e da linguagem humana. Ignoraremos os recursos de banco de dados do ElasticSearch e lançaremos algum texto nele e veremos como ele tokeniza os dados.

Dependendo do analisador que você usa, o ElasticSearch irá tokenizar e armazenar os dados de uma maneira diferente. Não se preocupe, os dados originais permanecerão na origem do documento, é o índice invertido que muda.

Exercício de carga 4

Exercício 5: sem esquema? Na verdade.

O exercício 5 trata do esquema de um índice. ElasticSearch é comercializado como sem esquema. Na realidade, o ElasticSearch adivinhará o esquema para você.

Mostrarei exemplos em que ele adivinha com sucesso e exemplos em que não.

Exercício de carga 5

Exercício 6: mapeamento

Para evitar que o ElasticSearch adivinhe o esquema errado, o mapeamento explícito é uma boa ideia. O Exercício 6 configurará o mapeamento correto para nosso exemplo de blog e reinserirá os dados.

Inteiros e strings serão definidos de acordo e a data terá o formato correto.

O mapeamento explícito será usado no exercício 7.

Exercício de carga 6

Exercício 7: pesquisa usando mapeamento explícito

As 2 pesquisas do exercício 5 que falharam serão agora executadas novamente. Graças ao mapeamento explícito, a saída estará correta.

A consulta 1 não retornará nada porque o intervalo não corresponde
As consultas 2 e 3 retornarão os documentos que se enquadram no intervalo de dados

Exercício de carga 7

Exercício 8: campos não analisados

No exercício 8, definiremos ainda outro mapeamento no índice do nosso blog. Este mapeamento trata apenas o campo "título" como texto completo. O restante das strings não será analisado e tokenizado. Eles serão armazenados "como estão" .

Esses dados serão usados no exercício 9.

Exercício de carga 8

Exercício 9: filtros, texto completo versus valores exatos

No exercício 9, mostrarei a diferença entre pesquisas de texto completo usando consultas e correspondências de valores exatos usando consultas no modo de filtro.

O mapeamento feito no exercício 8 garantiu que agora exista um campo "palavra-chave" na propriedade title. Isso significa que as consultas em "título" são tratadas como pesquisas de texto completo e os filtros booleanos no campo "título.keyword" regular são tratados como correspondências de valores exatos.

Em um dos exemplos, também mostrarei como combinar múltiplas consultas e filtros.

Isto é o que faremos neste exercício:

Use uma consulta de prefixo no contexto de filtro para realizar uma pesquisa curinga, mesmo que os campos não sejam analisados
Faça uma consulta padrão usando o campo “palavra-chave”
Use uma consulta booleana no modo de filtro para combinar vários filtros com base nos operadores "e" , "ou" e "não"
Use uma consulta booleana regular e observe como o comportamento da cláusula (should) muda

Exercício de carga 9

Exercício 10: mapeamento baseado em linguagem

Iremos novamente remapear os dados. Desta vez trataremos a propriedade “title” como um campo analisado. Por padrão, o analisador "padrão" é usado. Como nossos dados estão em holandês e inglês, adicionei 2 campos:

O "en" usa explicitamente o analisador inglês
O "nl" usa explicitamente o analisador holandês

Esta é a versão final do mapeamento. Os outros exemplos usarão esse mapeamento e dados.

Exercício de carga 10

Exercício 11: usando idiomas

O Exercício 11 trata da análise de texto, com base no idioma. O Exercício 4 foi uma dica para a análise dos dados. Agora realizaremos pesquisas que dependem da análise da linguagem.

A consulta 1 procurará o termo “trabalho” na propriedade “título”
A consulta 2 procurará o termo "work" no campo "title.en" (que utiliza o analisador inglês)
A consulta 3 procurará o termo "werk" na propriedade "title"
A consulta 4 procurará o termo "werk" no campo "title.nl" (que usa o analisador holandês)

Exercício de carga 11

Exercício 12: dados geográficos

No exercício 12, criaremos um novo índice de “cidades” , que contém todas as cidades localizadas na província de West-Vlaanderen , na Bélgica. O índice armazena o nome da cidade e suas coordenadas geográficas.

O mapeamento explícito e os dados serão utilizados em outros exercícios.

Exercício de carga 12

Exercício 13: pesquisas geográficas

No exercício anterior, criamos um novo índice e indexamos alguns dados geográficos. No exercício 13, realizaremos pesquisas nesses dados.

2 consultas serão apresentadas:

Uma consulta que exibe todas as cidades num raio de 5 km de Diksmuide
Uma consulta que exibe todas as cidades localizadas em uma caixa delimitadora específica (entre Koksijde e Nieuwpoort)

Exercício de carga 13

Exercício 14: agregação de dados

No exercício 14, carregaremos os dados em outro índice. Esse índice é chamado de “carros” e contém informações sobre vendas de automóveis. Cada transação mantém registro das seguintes informações:

O preço da venda
A marca do carro que foi vendido
A cor do carro
Os dados da venda

Esta informação será usada no exercício 15.

Exercício de carga 14

Exercício 15: realizando agregações

As agregações são um recurso muito poderoso do ElasticSearch. É basicamente como "agrupar por" em SQL, mas muito mais poderoso. As agregações são a razão pela qual o ElasticSearch é popular na comunidade de big data e ciência de dados.

Estas são as agregações que executaremos neste exercício:

Obtenha os 10 autores mais populares do blog Combell
Obtenha os 10 autores mais populares do blog Combell e exiba quantas postagens eles escreveram em cada idioma
Obtenha todas as postagens do blog escritas em holandês, publicadas em 2016. Use agregações para ver o valor por mês
Obtenha os 3 carros mais populares
Obtenha o preço médio de um carro vendido
Obtenha estatísticas estendidas sobre o preço de um carro vendido
Obtenha a receita total de carros por faixa de preço, com intervalo de 20.000 USD
Calcule o preço médio de um Ford, versus o preço médio total de todos os carros que foram vendidos

Exercício de carga 15

Expandir

Informações adicionais

Versão 1.0.0
Tipo Outro código-fonte
Data da Última Atualização 2024-12-26
tamanho 219.01KB
Vindo de Github

Aplicativos Relacionados

OpenCore_NO_ACPI_Build

2024-11-13
nspanel_pro_tools_apk

2024-11-12
zkwork_aleo_gpu_worker

2024-11-11
nextcloud_share_url_downloader

2024-11-01
elasticsearch

2024-11-01
Mecanismo de análise de dados Lihua versão gratuita 3.0_search_navigation_collection_public parecer_ranking_api

2022-06-28

Recomendado para você

chat.petals.dev

Outro código-fonte

1.0.0
GPT Prompt Templates

Outro código-fonte

1.0.0
GPTyped

Outro código-fonte

GPTyped 1.0.5
waymo open dataset

Outro código-fonte

December 2023 Update
SmartTube

Outro código-fonte

24.71 Stable
Sunamu

Outro código-fonte

Release 2.2.0
waymo open dataset

Outro código-fonte

December 2023 Update
termwind

Outras categorias

v2.3.0
wp functions

Outras categorias

1.0.0

Informações Relacionadas Todos