elasticsearch_tutorial Télécharger - elasticsearch_tutorial Téléchargement du code source

elasticsearch_tutorial

Autre code source

1.0.0

Télécharger

Clause de non-responsabilité

Ce didacticiel est conçu pour ElasticSearch version 5.2. La version 5 présente de nombreuses modifications importantes en termes de requêtes DSL et de mappage.

Si vous utilisez toujours la version 2.x, veuillez consulter la branche v2 de ce référentiel .

Exemples d'ElasticSearch

J'ai rassemblé de nombreux exemples pour présenter les fonctionnalités et la puissance d'ElasticSearch. Une grande partie des informations est basée sur "ElasticSearch, The Definitive Guide".

Installation

Téléchargez ElasticSearch et Kibana ici, puis suivez ces étapes simples :

Installez ElasticSearch et Kibana.
Exécutez ElasticSearch ./bin/elasticsearch
Exécutez Kibana ./bin/kibana
Utilisez la console Kibana en accédant à http://localhost:5601/app/kibana#/dev_tools/console

Exercice 1 : les bases

L'exercice 1 est très simple et le but est de maîtriser l'interface ElasticSearch RESTFul.

Sujets :

Accès à la page de destination d'ElasticSearch
Rechercher tous les documents
Comptage des documents
Ajout de documents à l'index
Mises à jour complètes du document
Mises à jour partielles des documents
Récupérer des documents individuels
Recherche dans tous les documents pour un index spécifique

Exercice de charge 1

Exercice 2 : charger des données en masse

Dans l’exercice 2, nous indexerons un grand nombre de données. Pour améliorer les performances, nous faisons cela en masse.

Ces données contiennent des informations du blog Combell. J'ai indexé les informations suivantes :

Titre
Auteur
Date
Catégories
Langue
GUID

Ces données seront utilisées dans les autres exercices.

Charger les données du blog en masse

Exercice 3 : rechercher, connaître la requête DSL

Dans l'exercice 3, nous effectuons quelques requêtes de base à l'aide de la requête ElasticSearch DSL. Le DSL est basé sur JSON et les requêtes sont des recherches en texte intégral.

Voici quelques recherches que nous effectuons :

Rechercher un seul terme dans un index
Rechercher plusieurs termes dans un index
Effectuer des recherches sur plusieurs termes à l'aide de l'opérateur "et"
Définir le nombre minimum de correspondances qu'un document doit avoir
Définir la proximité des termes que vous recherchez

Exercice de charge 3

Exercice 4 : analyse

Dans l'exercice 4, nous allons nous concentrer sur l'analyse du texte intégral et du langage humain. Nous allons ignorer les capacités de base de données d'ElasticSearch, y ajouter du texte et voir comment il tokenise les données.

En fonction de l'analyseur que vous utilisez, ElasticSearch tokenisera et stockera les données d'une manière différente. Ne vous inquiétez pas, les données originales resteront dans la source du document, c'est l'index inversé qui change.

Exercice de charge 4

Exercice 5 : sans schéma ? Pas vraiment.

L'exercice 5 concerne le schéma d'un index. ElasticSearch est commercialisé comme étant sans schéma. En réalité, ElasticSearch devinera le schéma pour vous.

Je vais vous montrer des exemples où il devine avec succès et des exemples où il ne parvient pas.

Exercice de charge 5

Exercice 6 : cartographie

Pour éviter qu'ElasticSearch ne devine mal le schéma, un mappage explicite est une bonne idée. L'exercice 6 configurera le bon mappage pour notre exemple de blog et réinsérera les données.

Les entiers et les chaînes seront définis en conséquence et la date aura le bon format.

La cartographie explicite sera utilisée dans l’exercice 7.

Exercice de charge 6

Exercice 7 : recherche à l'aide d'un mappage explicite

Les 2 recherches de l'exercice 5 qui ont échoué vont désormais être à nouveau exécutées. Grâce au mappage explicite, le résultat sera correct.

La requête 1 ne renverra rien, car la plage ne correspond pas
Les requêtes 2 et 3 renverront les documents qui correspondent à la plage de données

Exercice de charge 7

Exercice 8 : champs non analysés

Dans l'exercice 8, nous définirons encore un autre mappage sur notre index de blog. Ce mappage traite uniquement le champ « titre » comme du texte intégral. Le reste des chaînes ne sera pas analysé ni tokenisé. Ils seront stockés "tels quels" .

Ces données seront utilisées dans l'exercice 9.

Exercice de charge 8

Exercice 9 : filtres, texte intégral et valeurs exactes

Dans l'exercice 9, je vais vous montrer la différence entre les recherches en texte intégral utilisant des requêtes et les correspondances de valeurs exactes utilisant des requêtes en mode filtre.

Le mappage effectué dans l'exercice 8 a permis de garantir qu'il existe désormais un champ « mot-clé » sur la propriété title. Cela signifie que les requêtes sur « title » sont traitées comme des recherches en texte intégral et que les filtres booléens sur le champ « title.keyword » standard sont traités comme des correspondances de valeurs exactes.

Dans l'un des exemples, je vais également vous montrer comment combiner plusieurs requêtes et filtres.

Voici ce que nous allons faire dans cet exercice :

Utilisez une requête de préfixe dans un contexte de filtre pour effectuer une recherche générique, même si les champs ne sont pas analysés
Faites une requête standard en utilisant le champ "mot clé"
Utilisez une requête booléenne en mode filtre pour combiner plusieurs filtres basés sur les opérateurs "et" , "ou" et "non"
Utilisez une requête booléenne régulière et remarquez comment le comportement de la clause (devrait) change

Exercice de charge 9

Exercice 10 : cartographie basée sur la langue

Nous allons à nouveau remapper les données. Cette fois, nous traiterons la propriété « title » comme un champ analysé. Par défaut, l'analyseur "standard" est utilisé. Comme nos données sont à la fois en néerlandais et en anglais, j'ai ajouté 2 champs :

Le "en" utilise explicitement l'analyseur anglais
Le "nl" utilise explicitement l'analyseur néerlandais

Il s'agit de la version finale de la cartographie. Les autres exemples utiliseront cette cartographie et ces données.

Exercice de charge 10

Exercice 11 : utiliser les langues

L'exercice 11 porte sur l'analyse du texte, en fonction de la langue. L'exercice 4 était une allusion à l'analyse des données. Nous allons maintenant effectuer des recherches qui dépendent de l'analyse linguistique.

La requête 1 recherchera le terme « œuvre » sur la propriété « titre »
La requête 2 va chercher le terme "work" sur le champ "title.en" (qui utilise l'analyseur anglais)
La requête 3 recherchera le terme "werk" sur la propriété "title"
La requête 4 recherchera le terme "werk" sur le champ "title.nl" (qui utilise l'analyseur néerlandais)

Exercice de charge 11

Exercice 12 : données géographiques

Dans l'exercice 12, nous allons créer un nouvel index "villes" , qui contient toutes les villes situées dans la province de Flandre occidentale en Belgique. L'index stocke le nom de la ville et ses coordonnées géographiques.

La cartographie explicite et les données seront utilisées dans d'autres exercices.

Exercice de charge 12

Exercice 13 : recherches géographiques

Dans l'exercice précédent, nous avons créé un nouvel index et indexé certaines données géographiques. Dans l'exercice 13, nous effectuerons des recherches sur ces données.

2 requêtes seront présentées :

Une requête qui affiche toutes les villes dans un rayon de 5 km de Dixmude
Une requête qui affiche toutes les villes situées dans une zone de délimitation spécifique (entre Koksijde et Nieuwpoort)

Exercice de charge 13

Exercice 14 : agrégation de données

Dans l'exercice 14, nous chargerons les données dans un autre index. Cet index est appelé « voitures » et contient des informations sur les ventes de voitures. Chaque transaction conserve la trace des informations suivantes :

Le prix de la vente
La marque de la voiture vendue
La couleur de la voiture
Les données de la vente

Ces informations seront utilisées dans l’exercice 15.

Exercice de charge 14

Exercice 15 : réaliser des agrégations

Les agrégations sont une fonctionnalité très puissante d'ElasticSearch. C'est fondamentalement comme "group by" dans SQL, mais bien plus puissant. Les agrégations sont la raison pour laquelle ElasticSearch est populaire dans la communauté du Big Data et de la science des données.

Voici les agrégations que nous allons exécuter dans cet exercice :

Obtenez le top 10 des auteurs les plus populaires du blog Combell
Obtenez les 10 auteurs les plus populaires du blog Combell et affichez le nombre d'articles qu'ils ont écrits dans chaque langue
Obtenez tous les articles de blog rédigés en néerlandais et publiés en 2016. Utilisez des agrégations pour voir le montant mensuel
Obtenez le top 3 des voitures les plus populaires
Obtenez le prix moyen d'une voiture vendue
Obtenez des statistiques étendues sur le prix d'une voiture vendue
Obtenez le revenu total des voitures par gamme de prix, avec un intervalle de 20 000 USD
Calculez le prix moyen d'une Ford par rapport au prix moyen total de toutes les voitures vendues

Exercice de charge 15

Développer

Informations supplémentaires

Version 1.0.0
Type Autre code source
Date de mise à jour 2024-12-26
taille 219.01KB
Provenant de Github

Applications connexes

OpenCore_NO_ACPI_Build

2024-11-13
nspanel_pro_tools_apk

2024-11-12
zkwork_aleo_gpu_worker

2024-11-11
nextcloud_share_url_downloader

2024-11-01
elasticsearch

2024-11-01
Moteur d'analyse de données Lihua version gratuite 3.0_search_navigation_collection_public opinion_ranking_api

2022-06-28

Recommandé pour vous

chat.petals.dev

Autre code source

1.0.0
GPT Prompt Templates

Autre code source

1.0.0
GPTyped

Autre code source

GPTyped 1.0.5
waymo open dataset

Autre code source

December 2023 Update
SmartTube

Autre code source

24.71 Stable
Sunamu

Autre code source

Release 2.2.0
waymo open dataset

Autre code source

December 2023 Update
termwind

Autres catégories

v2.3.0
wp functions

Autres catégories

1.0.0

Actualités connexes Tout