Платформа с открытым исходным кодом для оценки, тестирования и мониторинга систем на базе машинного обучения и LLM.
Документация | Дискорд-сообщество | Блог | Твиттер | Очевидно, Облако
Очевидно 0.4.25 . Оценка LLM -> Учебное пособие
Очевидно, это библиотека Python с открытым исходным кодом для оценки и наблюдения ML и LLM. Он помогает оценивать, тестировать и контролировать системы и конвейеры данных на базе искусственного интеллекта — от экспериментов до производства.
Очевидно, он очень модульный. Вы можете начать с разовых оценок, используя Reports
или Test Suites
на Python, или воспользоваться службой Dashboard
мониторинга в реальном времени.
В отчетах вычисляются различные данные, показатели качества ML и LLM. Вы можете начать с пресетов или настроить их.
Отчеты |
---|
Наборы тестов проверяют определенные условия для значений метрик и возвращают результат «пройден» или «не пройден».
gt
(больше), lt
(меньше) и т. д.Тестовый набор |
---|
Служба мониторинга пользовательского интерфейса помогает визуализировать метрики и результаты тестирования с течением времени.
Вы можете выбрать:
Очевидно, Cloud предлагает щедрый уровень бесплатного пользования и дополнительные функции, такие как управление пользователями, оповещения и оценки без кода.
Панель управления |
---|
Очевидно, доступен в виде пакета PyPI. Чтобы установить его с помощью диспетчера пакетов pip, запустите:
pip install evidently
Чтобы установить Очевидно с помощью установщика conda, запустите:
conda install -c conda-forge evidently
Это простой Привет, мир. Дополнительные сведения см. в учебных пособиях: табличные данные или оценка LLM.
Импортируйте набор тестов , предустановку оценки и набор табличных данных.
import pandas as pd
from sklearn import datasets
from evidently . test_suite import TestSuite
from evidently . test_preset import DataStabilityTestPreset
iris_data = datasets . load_iris ( as_frame = True )
iris_frame = iris_data . frame
Разделите DataFrame
на эталонный и текущий. Запустите набор тестов стабильности данных , который автоматически сгенерирует проверки диапазонов значений столбцов, пропущенных значений и т. д. на основе справочника. Получите результат в блокноте Jupyter:
data_stability = TestSuite ( tests = [
DataStabilityTestPreset (),
])
data_stability . run ( current_data = iris_frame . iloc [: 60 ], reference_data = iris_frame . iloc [ 60 :], column_mapping = None )
data_stability
Вы также можете сохранить HTML-файл. Вам нужно будет открыть его из папки назначения.
data_stability . save_html ( "file.html" )
Чтобы получить вывод в формате JSON:
data_stability . json ()
Вы можете выбрать другие пресеты, отдельные тесты и установить условия.
Импортируйте отчет , предустановку оценки и набор табличных данных.
import pandas as pd
from sklearn import datasets
from evidently . report import Report
from evidently . metric_preset import DataDriftPreset
iris_data = datasets . load_iris ( as_frame = True )
iris_frame = iris_data . frame
Запустите отчет о смещении данных , который сравнит распределение столбцов между current
и reference
:
data_drift_report = Report ( metrics = [
DataDriftPreset (),
])
data_drift_report . run ( current_data = iris_frame . iloc [: 60 ], reference_data = iris_frame . iloc [ 60 :], column_mapping = None )
data_drift_report
Сохраните отчет в формате HTML. Позже вам нужно будет открыть его из папки назначения.
data_drift_report . save_html ( "file.html" )
Чтобы получить вывод в формате JSON:
data_drift_report . json ()
Вы можете выбрать другие предустановки и отдельные метрики, включая оценки LLM для текстовых данных.
Это запустит демонстрационный проект в пользовательском интерфейсе Evidently. Ознакомьтесь с учебными пособиями по самостоятельному хостингу или очевидному облаку.
Рекомендуемый шаг: создайте виртуальную среду и активируйте ее.
pip install virtualenv
virtualenv venv
source venv/bin/activate
После установки Evidently ( pip install evidently
) запустите Evidently UI с демонстрационными проектами:
evidently ui --demo-projects all
Получите доступ к сервису Evidently UI в своем браузере. Перейдите на локальный хост:8000 .
Очевидно, имеет более 100 встроенных оценок. Вы также можете добавить собственные. Каждая метрика имеет дополнительную визуализацию: ее можно использовать в Reports
, Test Suites
или отображать на Dashboard
.
Вот примеры того, что вы можете проверить:
? Текстовые дескрипторы | Результаты LLM |
Длина, тональность, токсичность, язык, специальные символы, совпадения с регулярными выражениями и т. д. | Семантическое сходство, релевантность поиска, качество обобщения и т. д. с помощью оценок на основе моделей и LLM. |
? Качество данных | Дрейф распределения данных |
Отсутствующие значения, дубликаты, диапазоны мин-макс, новые категориальные значения, корреляции и т. д. | Более 20 статистических тестов и показателей расстояния для сравнения изменений в распределении данных. |
Классификация | ? Регрессия |
Точность, прецизионность, полнота, ROC AUC, матрица путаницы, систематическая ошибка и т. д. | MAE, ME, RMSE, распределение ошибок, нормальность ошибок, смещение ошибок и т. д. |
? Рейтинг (включая RAG) | ? Рекомендации |
NDCG, MAP, MRR, частота попаданий и т. д. | Интуитивность, новизна, разнообразие, предвзятость популярности и т. д. |
Мы приветствуем вклады! Прочтите Руководство, чтобы узнать больше.
Для получения дополнительной информации обратитесь к полной документации. Вы можете начать с обучающих программ:
Дополнительные примеры см. в документации.
Изучите практические руководства, чтобы понять особенности функций Evidently.
Если вы хотите общаться и общаться, присоединяйтесь к нашему сообществу Discord!