注意:开放式剂已完成,并且该项目现已完成。感谢所有贡献的人!查看我们的博客文章以获取更多信息。最终发布的OASST2数据集可以在OpenAssistant/OASST2的HuggingFace上找到
Open Assistant是一个旨在让每个人都可以访问出色的基于聊天的大语言模型的项目。
我们相信,通过这样做,我们将建立语言创新革命。就像稳定扩散以新的方式帮助世界创造艺术和图像的方式一样,我们希望开放助理可以通过改善语言本身来帮助改善世界。
数据收集
聊天
项目文档
聊天前端现在住在这里。登录并开始聊天!聊天时,请尝试对助手的反应进行反应。
数据收集前端现在在这里使用。登录并开始执行任务!我们想收集大量质量数据。通过提交,排名和标签模型提示和响应,您将直接帮助提高开放助手的能力。
除非您为开发过程做出贡献,否则您无需在本地运行该项目。上面的网站链接将带您到公共网站,您可以在其中使用数据收集应用程序和聊天。
如果您想在本地运行Data Collection应用程序以进行开发,则可以设置运行开放式辅助设备所需的整个堆栈,包括网站,后端和与Docker相关的依赖服务。
要启动演示,请在存储库的根目录中运行此操作(如果有问题,请检查此常见问题解答):
docker compose --profile ci up --build --attach-dependencies
注意:使用M1芯片在MacOS上运行时,您必须使用:
DB_PLATFORM=linux/x86_64 docker compose ...
然后,导航到http://localhost:3000
(可能需要一些时间来启动)并与网站进行交互。
注意:如果构建发生问题,请前往常见问题解答并查看有关Docker的条目。
注意:通过电子邮件登录时,请导航到
http://localhost:1080
获取魔术电子邮件登录链接。
注意:如果您想在本地或使用github codespese的Web浏览器中使用标准化的开发环境(“ DevContainer”)运行此操作,则可以使用提供的
.devcontainer
文件夹。
除非您为开发过程做出贡献,否则您无需在本地运行该项目。上面的网站链接将带您到公共网站,您可以在其中使用数据收集应用程序和聊天。
另请注意,本地设置仅用于开发,并且不应用作本地聊天机器人,除非您知道自己在做什么。
如果您确实知道自己在做什么,请查看inference
文件夹,以使推理系统启动和运行,或者在上述命令中查看--profile ci
之外的--profile inference
。
我们不会停止复制chatgpt。我们希望建立未来的助手,不仅能够写电子邮件和求职信,而且可以做有意义的工作,使用API,动态研究信息等等,并能够由任何人进行个性化和扩展。我们想以一种开放且可访问的方式来执行此操作,这意味着我们不仅必须建立一个出色的助手,而且还必须使其小巧且高效地运行消费者硬件。
然后,我们可以采用生成的模型,并继续进行下一个迭代的完成步骤2。
视觉和路线图
重要的数据结构
所有开源项目都始于像您这样的人。开源的信念是,如果我们合作,我们可以将我们的知识和技术共同为人类的利益赋予世界。
查看我们的贡献指南以开始。