Nota : OpenAsistant se completa y el proyecto ya está terminado. ¡Gracias a todos los que contribuyeron! Consulte nuestra publicación de blog para obtener más información. El último conjunto de datos OASST2 publicado en Huggingface en OpenAssistant/OASST2
Open Assistant es un proyecto destinado a darles a todos acceso a un excelente modelo de idioma grande basado en chat.
Creemos que al hacer esto crearemos una revolución en la innovación en el lenguaje. De la misma manera que la difusión estable ayudó al mundo a hacer arte e imágenes de nuevas maneras, esperamos que el asistente abierto pueda ayudar a mejorar el mundo mejorando el lenguaje en sí.
Recopilación de datos
Charlar
Documentación del proyecto
El frontend del chat ahora está en vivo aquí. ¡Inicie sesión y comience a chatear! Intente reaccionar con un pulgar hacia arriba o hacia abajo para las respuestas del asistente al chatear.
El frontend de recopilación de datos ahora está en vivo aquí. ¡Inicie sesión y comience a asumir tareas! Queremos recopilar un alto volumen de datos de calidad. Al enviar, clasificar y etiquetar las solicitudes y respuestas del modelo, ayudará directamente a mejorar las capacidades del asistente abierto.
No necesita ejecutar el proyecto localmente a menos que esté contribuyendo al proceso de desarrollo. El enlace del sitio web anterior lo llevará al sitio web público donde puede usar la aplicación de recopilación de datos y el chat.
Si desea ejecutar la aplicación de recopilación de datos localmente para el desarrollo, puede configurar una pila completa necesaria para ejecutar asistentes abiertos , incluidos el sitio web, el backend y los servicios dependientes asociados, con Docker.
Para comenzar la demostración, ejecute esto en el directorio raíz del repositorio (verifique estas preguntas frecuentes si tiene problemas):
docker compose --profile ci up --build --attach-dependencies
Nota: Cuando se ejecuta en macOS con un chip M1, debe usar:
DB_PLATFORM=linux/x86_64 docker compose ...
Luego, navegue a http://localhost:3000
(puede llevar algo de tiempo arrancarse) e interactuar con el sitio web.
Nota: Si se produce un problema con la compilación, diríjase a las preguntas frecuentes y consulte las entradas sobre Docker.
Nota: Al iniciar sesión por correo electrónico, navegue a
http://localhost:1080
para obtener el enlace de inicio de sesión de correo electrónico mágico.
Nota: Si desea ejecutar esto en un entorno de desarrollo estandarizado (un "DevContainer") que usa VScode localmente o en un navegador web utilizando GitHub CodeSpaces, puede usar la carpeta
.devcontainer
proporcionada.
No necesita ejecutar el proyecto localmente a menos que esté contribuyendo al proceso de desarrollo. El enlace del sitio web anterior lo llevará al sitio web público donde puede usar la aplicación de recopilación de datos y el chat.
También tenga en cuenta que la configuración local es solo para el desarrollo y no está destinada a usarse como un chatbot local, a menos que sepa lo que está haciendo.
Si sabe lo que está haciendo, consulte la carpeta de inference
para que el sistema de inferencia esté en funcionamiento, o eche un vistazo a --profile inference
además de --profile ci
en el comando anterior.
No vamos a dejar de replicar chatgpt. Queremos construir el asistente del futuro, capaces de no solo escribir correos electrónicos y cartas de presentación, sino también hacer un trabajo significativo, usar API, investigar información dinámica y mucho más, con la capacidad de ser personalizado y extendido por cualquier persona. Y queremos hacer esto de una manera abierta y accesible, lo que significa que no solo debemos construir un gran asistente, sino también hacerlo lo suficientemente pequeño y eficiente como para ejecutarse en hardware del consumidor.
Luego podemos tomar el modelo resultante y continuar con el paso de muestreo de finalización, el paso 2 para una próxima iteración.
Visión y hoja de ruta
Estructuras de datos importantes
Todos los proyectos de código abierto comienzan con personas como tú. El código abierto es la creencia de que si colaboramos, podemos regalar nuestro conocimiento y tecnología al mundo en beneficio de la humanidad.
Echa un vistazo a nuestra guía contribuyente para comenzar.