Управляющие векторы/инжиниринг представления для моделей языка трансформеров в Pytorch/Huggingface
Посмотрите наш пример блокнота.
Полная документация: https://steering-vectors.github.io/steering-vectors.
Эта библиотека предоставляет утилиты для обучения и применения векторов управления к языковым моделям (LM) из Huggingface, таким как GPT, LLaMa, Gemma, Mistral, Pythia и многим другим!
Эта библиотека основана на идеях и коде из следующих двух статей. Для получения дополнительной информации о векторах управления и разработке представлений ознакомьтесь с этими работами:
pip install steering-vectors
Ознакомьтесь с полной документацией для получения дополнительной информации об использовании.
Любой вклад в улучшение этого проекта приветствуется! Пожалуйста, откройте проблему или запрос на включение в этом репозитории с любыми исправлениями/изменениями/улучшениями, которые у вас есть.
В этом проекте используется Ruff для форматирования и проверки кода, MyPy для проверки типов и Pytest для тестов. Убедитесь, что все отправляемые вами изменения проходят проверку кода в вашем PR. Если у вас возникли проблемы с их запуском, не стесняйтесь открыть запрос на включение, и мы сможем обсудить это дальше в PR.
Этот код выпущен под лицензией MIT.