Небольшие (7B и ниже), готовые к использованию, точно настроенные LLM для разнообразного набора полезных задач.
Поддерживаемые задачи: Перефразирование, Изменение тона отрывка, Создание резюме и темы из диалога, Получение расширенного контроля качества (WIP) .
Мы настраиваем LoRA на квантованных моделях 3B и 7B. Модель 3Б настроена на конкретные задачи, а модель 7Б — на все задачи.
Цель состоит в том, чтобы иметь возможность точно настроить и использовать все эти модели на очень скромном оборудовании потребительского уровня.
pip install llm-toys
Может не работать без графического процессора с поддержкой CUDA.
Если вы столкнулись с сообщением «Установленная версия bitsandbytes была скомпилирована без поддержки графического процессора» с bitsandbytes, посмотрите здесь bitsandbytes-foundation/bitsandbytes#112.
или попробуй
cp <path_to_your_venv>/lib/python3.10/site-packages/bitsandbytes/libbitsandbytes_cpu.so <path_to_your_venv>/lib/python3.10/site-packages/bitsandbytes/libbitsandbytes_cuda117.so
Обратите внимание, что мы используем пакеты Transformers и Peft из исходного каталога, а не установленного пакета. Квантование 4-битных битов и байтов работало только с основной ветвью преобразователей и пефта. Как только версия Transformers 4.31.0 и peft 0.4.0 будут опубликованы в pypi, мы будем использовать опубликованную версию.
Модель | Размер | Задачи | Колаб |
---|---|---|---|
llm-toys/RedPajama-INCITE-Base-3B-v1-перефраз-тон | 3Б | Перефразирование, изменение тона | Блокнот |
llm-toys/RedPajama-INCITE-Base-3B-v1-диалог-сводка-тема | 3Б | Резюме диалога и создание тем | Блокнот |
llm-toys/falcon-7b-парафраз-тон-диалога-сводка-тема | 7Б | Перефразирование, изменение тона, подведение итогов диалога и создание тем. | Блокнот |
from llm_toys . tasks import Paraphraser
paraphraser = Paraphraser ()
paraphraser . paraphrase ( "Hey, can yuo hepl me cancel my last order?" )
# "Could you kindly assist me in canceling my previous order?"
paraphraser . paraphrase ( "Hey, can yuo hepl me cancel my last order?" , tone = "casual" )
# "Hey, could you help me cancel my order?"
paraphraser . paraphrase ( "Hey, can yuo hepl me cancel my last order?" , tone = "professional" )
# "I would appreciate guidance on canceling my previous order."
paraphraser . paraphrase ( "Hey, can yuo hepl me cancel my last order?" , tone = "witty" )
# "Hey, I need your help with my last order. Can you wave your magic wand and make it disappear?"
from llm_toys . tasks import SummaryAndTopicGenerator
summary_topic_generator = SummaryAndTopicGenerator ()
summary_topic_generator . generate_summary_and_topic (
"""
#Person1#: I'm so excited for the premiere of the latest Studio Ghibli movie!
#Person2#: What's got you so hyped?
#Person1#: Studio Ghibli movies are pure magic! The animation, storytelling, everything is incredible.
#Person2#: Which movie is it?
#Person1#: It's called "Whisper of the Wind." It's about a girl on a magical journey to save her village.
#Person2#: Sounds amazing! I'm in for the premiere.
#Person1#: Great! We're in for a visual masterpiece and a heartfelt story.
#Person2#: Can't wait to be transported to their world.
#Person1#: It'll be an unforgettable experience, for sure!
""" . strip ()
)
# {"summary": "#Person1# is excited for the premiere of the latest Studio Ghibli movie.
# #Person1# thinks the animation, storytelling, and heartfelt story will be unforgettable.
# #Person2# is also excited for the premiere.",
# "topic": "Studio ghibli movie"}
from llm_toys . tasks import GeneralTaskAssitant
from llm_toys . config import TaskType
gta = GeneralTaskAssitant ()
gta . complete ( TaskType . PARAPHRASE_TONE , "Hey, can yuo hepl me cancel my last order?" )
# "Could you assist me in canceling my previous order?"
gta . complete ( TaskType . PARAPHRASE_TONE , "Hey, can yuo hepl me cancel my last order?" , tone = "casual" )
# "Hey, can you help me cancel my last order?"
gta . complete ( TaskType . PARAPHRASE_TONE , "Hey, can yuo hepl me cancel my last order?" , tone = "professional" )
# "I would appreciate if you could assist me in canceling my previous order."
gta . complete ( TaskType . PARAPHRASE_TONE , "Hey, can yuo hepl me cancel my last order?" , tone = "witty" )
# "Oops! Looks like I got a little carried away with my shopping spree. Can you help me cancel my last order?"
chat = """
#Person1#: I'm so excited for the premiere of the latest Studio Ghibli movie!
#Person2#: What's got you so hyped?
#Person1#: Studio Ghibli movies are pure magic! The animation, storytelling, everything is incredible.
#Person2#: Which movie is it?
#Person1#: It's called "Whisper of the Wind." It's about a girl on a magical journey to save her village.
#Person2#: Sounds amazing! I'm in for the premiere.
#Person1#: Great! We're in for a visual masterpiece and a heartfelt story.
#Person2#: Can't wait to be transported to their world.
#Person1#: It'll be an unforgettable experience, for sure!
""" . strip ()
gta . complete ( TaskType . DIALOGUE_SUMMARY_TOPIC , chat )
# {"summary": "#Person1# tells #Person2# about the upcoming Studio Ghibli movie.
# #Person1# thinks it's magical and #Person2#'s excited to watch it.",
# "topic": "Movie premiere"}
Перефразирование и изменение тона: Содержит отрывки и их перефразированные версии, а также отрывки в разных тонах: непринужденный, профессиональный и остроумный. Используется в моделях для перефразирования и изменения тона отрывка. Данные были сгенерированы с использованием gpt-35-turbo. Небольшая выборка обучающих отрывков также была взята из вопросов Quora и наборов данных Squad_2.
Краткое описание диалогов и создание тем: Содержит диалоги, их краткое содержание и темы. Данные обучения составляют примерно 1 тыс. записей из обучающего разделения набора данных Dialogsum. Он также содержит около 20 образцов из раздела разработчиков. Точки данных с более длинными резюме и темами имели приоритет при выборке. Обратите внимание, что некоторые (около 30) тем были отредактированы вручную в окончательных данных обучения, поскольку исходная пометка «Тема» была просто словом и недостаточно описательной.
Чтобы рассмотреть все варианты
python llm_toys/train.py --help
Обучить модели перефразирования и изменения тона.
python llm_toys/train.py
--task_type paraphrase_tone
--model_name meta-llama/Llama-2-7b
--max_length 128
--batch_size 8
--gradient_accumulation_steps 1
--learning_rate 1e-4
--num_train_epochs 3
--eval_ratio 0.05
НЗП
Оценка производится по 500 записям из тестового разделения Dialogsum.
# llm-toys/RedPajama-INCITE-Base-3B-v1-dialogue-summary-topic
{ "rouge1" : 0.453 , "rouge2" : 0.197 , "rougeL" : 0.365 , "topic_similarity" : 0.888 }
# llm-toys/falcon-7b-paraphrase-tone-dialogue-summary-topic
{ 'rouge1' : 0.448 , 'rouge2' : 0.195 , 'rougeL' : 0.359 , 'topic_similarity' : 0.886 }