ПРИМЕЧАНИЕ : OpenAssistant завершен, а проект теперь закончен. Спасибо всем, кто внес свой вклад! Ознакомьтесь с нашим сообщением в блоге для получения дополнительной информации. Окончательный опубликованный набор данных OASST2 можно найти на HuggingFace на OpenAssistant/OASST2
Open Assistant - это проект, предназначенный для того, чтобы дать каждому доступ к отличной крупной языковой модели, основанной на чате.
Мы считаем, что, делая это, мы создадим революцию в инновациях в языке. Точно так же, что стабильная диффузия помогла миру сделать искусство и образы новым способом, мы надеемся, что открытый помощник может помочь улучшить мир, улучшив сам язык.
Сбор данных
Чат
Проектная документация
Благодарность чата теперь живет здесь. Войдите и начните общаться! Пожалуйста, попробуйте отреагировать с большими пальцами вверх или вниз, чтобы получить ответы помощника при чате.
Фронт сбора данных теперь живет здесь. Войдите и начните выполнять задачи! Мы хотим собрать большой объем качественных данных. Отправляя, ранжирование и маркировка модели подсказки и ответы, вы будете непосредственно помогать улучшить возможности открытого помощника.
Вам не нужно запускать проект локально, если вы не участвуете в процессе разработки. Ссылка на веб -сайт выше приведет вас к публичному веб -сайту, где вы можете использовать приложение для сбора данных и чат.
Если вы хотите запустить приложение для сбора данных локально для разработки, вы можете настроить целый стек, необходимый для запуска открытого ассистента , включая веб-сайт, бэкэнд и связанные с ними зависимые службы, с Docker.
Чтобы запустить демонстрацию, запустите это в корневом каталоге репозитория (проверьте этот часто задаваемые вопросы, если у вас есть проблемы):
docker compose --profile ci up --build --attach-dependencies
ПРИМЕЧАНИЕ. При запуске на MacOS с помощью чипа M1 вы должны использовать:
DB_PLATFORM=linux/x86_64 docker compose ...
Затем перейдите к http://localhost:3000
(для загрузки может потребоваться некоторое время) и взаимодействовать с веб -сайтом.
ПРИМЕЧАНИЕ. Если возникает проблема с сборкой, пожалуйста, отправляйтесь в FAQ и ознакомьтесь с записями о Docker.
ПРИМЕЧАНИЕ. При входе по электронной почте перейдите по
http://localhost:1080
чтобы получить ссылку на вход в электронную почту Magic.
ПРИМЕЧАНИЕ. Если вы хотите запустить это в стандартизированной среде разработки («DevContainer»), используя VSCODE локально или в веб -браузере с использованием кодексов GitHub, вы можете использовать предоставленную папку
.devcontainer
.
Вам не нужно запускать проект локально, если вы не участвуете в процессе разработки. Ссылка на веб -сайт выше приведет вас к публичному веб -сайту, где вы можете использовать приложение для сбора данных и чат.
Также обратите внимание, что локальная установка предназначена только для разработки и не предназначена для использования в качестве локального чат -бота, если только вы не знаете, что делаете.
Если вы знаете , что вы делаете, увидите папку inference
для получения и запуска системы вывода, или посмотрите на --profile inference
в дополнение к --profile ci
в вышеуказанной команде.
Мы не собираемся останавливаться на воспроизведении CHATGPT. Мы хотим построить помощника будущего, не только писать по электронной почте и сопроводительные письма, но и выполнять значимую работу, использовать API, динамически исследовать информацию и многое другое, с возможностью персонализировать и расширять любой. И мы хотим сделать это так, чтобы это было открыто и доступно, что означает, что мы должны не только построить отличного помощника, но и сделать его маленьким и достаточно эффективным для работы на потребительском оборудовании.
Затем мы можем взять полученную модель и продолжить с шагом 2 -го заполнения для следующей итерации.
Видение и дорожная карта
Важные структуры данных
Все проекты с открытым исходным кодом начинаются с таких людей, как вы. Открытый исходный код - это вера в то, что если мы сотрудничаем, мы можем вместе подарить миру свои знания и технологии на благо человечества.
Проверьте наше руководство для начала.