Загрузка elasticsearch_tutorial - elasticsearch_tutorial Загрузка исходного кода

elasticsearch_tutorial

Другой исходный код

1.0.0

Скачать

Отказ от ответственности

Это руководство создано для ElasticSearch версии 5.2. Версия 5 содержит ряд кардинальных изменений в отношении DSL запросов и сопоставления.

Если вы все еще используете версию 2.x, обратите внимание на ветку v2 этого репозитория .

Примеры ElasticSearch

Я собрал несколько примеров, чтобы продемонстрировать возможности и мощь ElasticSearch. Большая часть информации основана на «ElasticSearch, The Definitive Guide».

Установка

Загрузите ElasticSearch & Kibana здесь, а затем выполните следующие простые шаги:

Установите ElasticSearch и Kibana.
Запустите ElasticSearch ./bin/elasticsearch
Запустите Кибану ./bin/kibana
Используйте консоль Kibana, открыв http://localhost:5601/app/kibana#/dev_tools/console.

Упражнение 1: основы

Упражнение 1 очень простое, его цель — освоить интерфейс ElasticSearch RESTFul.

Темы:

Переход на целевую страницу ElasticSearch
Поиск всех документов
Подсчет документов
Добавление документов в индекс
Полное обновление документов
Частичное обновление документов
Получить отдельные документы
Поиск всех документов по определенному индексу

Нагрузочное упражнение 1

Упражнение 2. Массовая загрузка данных

В упражнении 2 мы будем индексировать большое количество данных. Чтобы улучшить производительность, мы делаем это массово.

Эти данные содержат информацию из блога Combell. Я проиндексировал следующую информацию:

Заголовок
Автор
Дата
Категории
Язык
ГУИД

Эти данные будут использоваться в других упражнениях.

Массовая загрузка данных блога

Упражнение 3: поиск, знакомство с запросом DSL

В упражнении 3 мы выполняем некоторые базовые запросы, используя DSL запросов ElasticSearch. DSL основан на JSON, а запросы представляют собой полнотекстовый поиск.

Вот несколько поисковых запросов, которые мы выполняем:

Поиск одного термина в индексе
Поиск нескольких терминов в индексе
Выполняйте поиск по нескольким терминам, используя оператор «и».
Определите минимальное количество совпадений, которые должен иметь документ.
Определите близость искомых слов

Нагрузочное упражнение 3

Упражнение 4: анализ

В упражнении 4 мы сосредоточимся на анализе полнотекстового и человеческого языка. Мы проигнорируем возможности базы данных ElasticSearch, добавим в нее немного текста и посмотрим, как он токенизирует данные.

В зависимости от используемого вами анализатора ElasticSearch будет токенизировать и хранить данные по-разному. Не волнуйтесь, исходные данные останутся в источнике документа, меняется инвертированный индекс.

Нагрузочное упражнение 4

Упражнение 5: бессхемное? Не совсем.

Упражнение 5 посвящено схеме индекса. ElasticSearch позиционируется как бессхемный. На самом деле ElasticSearch угадает схему за вас.

Я покажу вам примеры, когда он угадывает успешно, и примеры, когда нет.

Нагрузочное упражнение 5

Упражнение 6: картирование

Чтобы избежать того, что ElasticSearch неправильно угадает схему, хорошей идеей является явное сопоставление. Упражнение 6 позволит настроить правильное сопоставление для нашего примера блога и повторно вставить данные.

Целые числа и строки будут определены соответствующим образом, а дата будет иметь правильный формат.

Явное отображение будет использоваться в упражнении 7.

Нагрузочное упражнение 6

Упражнение 7: поиск с использованием явного сопоставления

Два поиска в упражнении 5, которые не увенчались успехом, теперь будут выполнены снова. Благодаря явному сопоставлению вывод будет правильным.

Запрос 1 ничего не вернет, поскольку диапазон не совпадает.
Запросы 2 и 3 вернут документы, соответствующие диапазону данных.

Нагрузочное упражнение 7

Упражнение 8: неанализируемые поля

В упражнении 8 мы определим еще одно сопоставление для индекса нашего блога. Это сопоставление рассматривает только поле «заголовок» как полнотекстовое. Остальные строки не будут анализироваться и токенизироваться. Они будут храниться «как есть» .

Эти данные будут использованы в упражнении 9.

Нагрузочное упражнение 8

Упражнение 9: фильтры, полнотекстовые и точные значения

В упражнении 9 я покажу вам разницу между полнотекстовым поиском с использованием запросов и точным совпадением значений с использованием запросов в режиме фильтра.

Сопоставление, выполненное в упражнении 8, обеспечило наличие поля «ключевое слово» в свойстве title. Это означает, что запросы по запросу «title» рассматриваются как полнотекстовый поиск, а логические фильтры в обычном поле «title.keyword» рассматриваются как точное совпадение значений.

В одном из примеров я также покажу, как объединить несколько запросов и фильтров.

Вот что мы будем делать в этом упражнении:

Используйте префиксный запрос в контексте фильтра для выполнения поиска по подстановочным знакам, даже если поля не анализируются.
Выполните стандартный запрос, используя поле «ключевое слово».
Используйте логический запрос в режиме фильтра, чтобы объединить несколько фильтров на основе операторов «и» , «или» и «не».
Используйте обычный логический запрос и обратите внимание, как изменится поведение предложения (следует).

Нагрузочное упражнение 9

Упражнение 10: отображение на основе языка

Мы снова пересопоставим данные. На этот раз мы будем рассматривать свойство «title» как анализируемое поле. По умолчанию используется «стандартный» анализатор. Поскольку наши данные представлены как на голландском, так и на английском языке, я добавил 2 поля:

«en» явно использует английский анализатор.
«nl» явно использует голландский анализатор.

Это окончательная версия картографии. В других примерах будет использоваться это сопоставление и данные.

Нагрузочное упражнение 10

Упражнение 11: использование языков

Упражнение 11 посвящено анализу текста на основе языка. Упражнение 4 было намеком на анализ данных. Теперь мы фактически выполним поиск, основанный на языковом анализе.

Запрос 1 будет искать термин «работа» в свойстве «title».
Запрос 2 будет искать термин «работа» в поле «title.en» (которое использует анализатор английского языка).
Запрос 3 будет искать термин «werk» в свойстве «title».
Запрос 4 будет искать термин «werk» в поле «title.nl» (которое использует голландский анализатор).

Нагрузочное упражнение 11

Упражнение 12: географические данные

В упражнении 12 мы создадим новый индекс «городов» , который будет содержать все города, расположенные в провинции Западная Влаандерен в Бельгии. В индексе хранится название города и его географические координаты.

Явное сопоставление и данные будут использоваться в других упражнениях.

Нагрузочное упражнение 12

Упражнение 13: географический поиск

В предыдущем упражнении мы создали новый индекс и проиндексировали некоторые географические данные. В упражнении 13 мы фактически выполним поиск по этим данным.

Будут показаны 2 запроса:

Запрос, отображающий все города в радиусе 5 км от Диксмюйде.
Запрос, отображающий все города, расположенные в определенной ограничивающей рамке (между Коксейде и Ньюпортом).

Нагрузочное упражнение 13

Упражнение 14: агрегирование данных

В упражнении 14 мы загрузим данные в еще один индекс. Этот индекс называется «автомобили» и содержит информацию о продажах автомобилей. Каждая транзакция отслеживает следующую информацию:

Цена продажи
Марка проданного автомобиля
Цвет автомобиля
Данные о продаже

Эта информация будет использоваться в упражнении 15.

Нагрузочное упражнение 14

Упражнение 15: выполнение агрегирования

Агрегации — очень мощная функция ElasticSearch. По сути, это похоже на «группировку» в SQL, но гораздо более эффективно. Агрегации являются причиной популярности ElasticSearch в сообществе специалистов по большим данным и наукам о данных.

Вот агрегаты, которые мы выполним в этом упражнении:

Получите топ-10 самых популярных авторов блога Combell
Получите топ-10 самых популярных авторов блога Combell и отобразите, сколько сообщений они написали на каждом языке.
Получите все сообщения в блоге, написанные на голландском языке и опубликованные в 2016 году. Используйте агрегаты, чтобы увидеть сумму в месяц.
Получите топ-3 самых популярных автомобилей
Получить среднюю цену проданного автомобиля
Получите расширенную статистику по цене проданного автомобиля
Получите общий доход по автомобилям по ценовому диапазону с интервалом 20000 долларов США.
Рассчитайте среднюю цену автомобиля Ford в сравнении с общей средней ценой всех проданных автомобилей.

Нагрузочное упражнение 15

Расширять

Дополнительная информация