DataGenie
DataGenie — это мощное веб-приложение, предназначенное для автоматизации двух ключевых процессов:
- Генерация отчетов : автоматическое создание отчетов в формате PDF из файлов CSV с предопределенными структурами, текстовыми сводками, таблицами и диаграммами.
- Интерактивный чат-бот : запрашивайте персонализированные данные, например PDF-файлы, и взаимодействуйте с ними, используя расширенные функции искусственного интеллекта, такие как сохранение памяти и оптимизированный поиск.
Оглавление
- Функции
- Предварительные условия
- Установка
- Конфигурация
- Использование
- Генератор отчетов
- Чат-бот
- Кастомизация
Функции
Генератор отчетов
- Автоматическое создание отчетов : создавайте комплексные отчеты на основе заранее определенных структур.
- Обобщение текста : автоматически суммируйте ключевые темы в ваших данных.
- Визуализации : легко интегрируйте таблицы и диаграммы в свои отчеты.
- Редактируемые выходные данные : загружайте и редактируйте отчеты в формате Word перед их завершением.
Чат-бот
- Взаимодействие с данными : загружайте отчеты и взаимодействуйте с ними в режиме реального времени.
- Сохранение памяти : для обеспечения непрерывности сохраняйте три последних состояния взаимодействия.
- Расширенный поиск : используйте оптимизаторы запросов RAG для расширения возможностей поиска.
- Удобный интерфейс: работайте с данными через оптимизированный и интуитивно понятный пользовательский интерфейс .
Предварительные условия
- Python 3.9 (или выше)
- Виртуальная среда (необязательно, но рекомендуется)
- Учетные данные Azure OpenAI
Установка
Чтобы начать работу с DataGenie, выполните следующие действия:
Клонируем репозиторий :
git clone < repository-url >
Создайте и активируйте виртуальную среду Python :
python -m venv venv
source venv/bin/activate # On Windows use `venvScriptsactivate`
Установить зависимости :
pip install -r requirements.txt
Конфигурация
Настройка Azure OpenAI
Вам необходимо обновить файл .env
в каталоге genai_utilits
указав свои учетные данные Azure OpenAI. Вы можете получить эти учетные данные здесь.
Пример конфигурации для .env
:
OPENAI_API_KEY = <your_azure_openai_api_key>
OPENAI_API_TYPE = <your_azure_openai_type e.g azure>
OPENAI_API_VERSION = <your_azure_openai_version>
OPENAI_ENDPOINT = <your_azure_openai_endpoint>
Использование
После завершения настройки запустите приложение Streamlit:
Приложение Streamlit будет доступно в вашем веб-браузере, где вы сможете загружать файлы для создания отчетов и чат-бота.
Генератор отчетов
Загрузить CSV-файл :
- Загрузите CSV-файл с экспортно-импортными данными. Образец файла (
dec_com_export.csv
) доступен в папке .assets
.
Создать отчет :
- Инструмент сгенерирует файл PDF и Word, хранящийся в
generated_report
.
Предопределенная структура отчета :
- Общие тенденции экспорта
- Пять крупнейших экспортных товаров
- Темпы роста экспорта
- Секторальный анализ
- Сравнение товаров
Вот демонстрационное видео генератора отчетов DataGenie в действии:
DataGenie_ReportGenerator.mp4
Чат-бот
Загрузить отчет :
- Загрузите отчет в формате PDF (например,
Introduction To New Gen Technology.pdf
расположенный в папке .assets
).
Чат с данными :
- Процесс включает в себя получение данных из PDF-файла, инициализацию VectorStore, подготовку данных для встраивания и запуск чата. Последние три состояния памяти сохраняются для обеспечения непрерывности.
Вот демонстрационное видео DataGenie ChatBot в действии:
freecompress-DataGenie-ChatBot.mp4
Кастомизация
Изменить аватары чата:
- Чтобы изменить аватарки в чат-боте, добавьте новые изображения в каталог
.assets
.
Настройка пользовательского интерфейса:
- Параметры настройки пользовательского интерфейса доступны в файле
config.toml
расположенном в каталоге .streamlit
. При необходимости измените внешний вид и настройки приложения Streamlit.