注:OpenAssistantが完了し、プロジェクトが完了しました。貢献してくれたすべての人に感謝します!詳細については、ブログ投稿をご覧ください。最終的に公開されたOASST2データセットは、OpenAssistant/OASST2のHuggingfaceにあります
Open Assistantは、優れたチャットベースの大手言語モデルに誰もがアクセスできるようにするプロジェクトです。
これを行うことで、言語の革新に革命を起こすと信じています。同じように、安定した拡散が世界が新しい方法で芸術とイメージを作るのを助けました。
データ収集
チャット
プロジェクトのドキュメント
チャットフロントエンドはここに住んでいます。ログインしてチャットを始めましょう!チャット時にアシスタントの回答について、上下に親指を立てて反応してみてください。
データ収集フロントエンドは現在ここに住んでいます。ログインして、タスクを始めましょう!大量の品質データを収集したいと考えています。モデルのプロンプトと応答を送信、ランキング、およびラベル付けすることにより、オープンアシスタントの機能を改善するのに直接役立ちます。
開発プロセスに貢献していない限り、プロジェクトをローカルに実行する必要はありません。上記のWebサイトリンクは、データ収集アプリとチャットを使用できるパブリックWebサイトにご紹介します。
開発のためにデータ収集アプリをローカルに実行したい場合は、Webサイト、バックエンド、関連する依存サービスなど、オープンアシスタントをDockerで実行するために必要なスタック全体を設定できます。
デモを開始するには、これをリポジトリのルートディレクトリで実行します(問題がある場合はこのFAQを確認してください):
docker compose --profile ci up --build --attach-dependencies
注: M1チップでmacOSで実行する場合、使用する必要があります:
DB_PLATFORM=linux/x86_64 docker compose ...
次に、 http://localhost:3000
に移動し(起動するのに時間がかかる場合があります)、Webサイトと対話します。
注:ビルドで問題が発生した場合は、FAQにアクセスして、Dockerのエントリをチェックしてください。
注:電子メールでログインする場合は、
http://localhost:1080
に移動して、Magic Emailログインリンクを取得します。
注:標準化された開発環境(「DevContainer」)でVSCodeをローカルに使用して、またはGitHub CodeSpacesを使用してWebブラウザで実行する場合は、提供された
.devcontainer
フォルダーを使用できます。
開発プロセスに貢献していない限り、プロジェクトをローカルに実行する必要はありません。上記のWebサイトリンクは、データ収集アプリとチャットを使用できるパブリックWebサイトにご紹介します。
また、ローカルセットアップは開発専用であり、自分が何をしているのかわからない限り、ローカルチャットボットとして使用することを意図していないことに注意してください。
自分が何をしているのかを知っている場合は、推論システムをアップして実行するためのinference
フォルダーを確認するか、上記のコマンドの--profile ci
に加えて--profile inference
を確認してください。
ChatGptの複製に停止するつもりはありません。私たちは、メールとカバーレターを書くだけでなく、意味のある仕事をし、APIを使用し、動的に研究情報などを使用して、誰もがパーソナライズおよび拡張する能力を備えているだけでなく、未来のアシスタントを構築したいと考えています。そして、私たちはこれをオープンでアクセスしやすい方法でやりたいと考えています。つまり、優れたアシスタントを構築するだけでなく、消費者ハードウェアで実行するのに十分な小さくて効率的にしなければなりません。
その後、結果のモデルを取得し、次の反復のために完了サンプリングステップ2を続けることができます。
ビジョンとロードマップ
重要なデータ構造
すべてのオープンソースプロジェクトは、あなたのような人々から始まります。オープンソースは、私たちが協力するならば、私たちは人類の利益のために私たちの知識と技術を世界に贈ることができるという信念です。
貢献ガイドをご覧ください。