Allen AI объявила об открытом исходном коде своей доработанной модели под названием OLMo-7B-Instruct, которая построена на наборе данных AI2 Dolma и содержит четыре варианта модели в масштабе 7B, каждая модель обучена как минимум с маркерами 2T. Эта инициатива с открытым исходным кодом направлена на содействие развитию исследований и приложений моделей. Allen AI также предоставляет полный пакет весов, оценки, а также код обучения и оценки, чтобы помочь пользователям полностью понять весь процесс, от моделей предварительного обучения до тонкой настройки RLHF. модели, предоставляя исследователям и разработчикам ценные ресурсы.
Allen AI недавно анонсировала модель тонкой настройки с открытым исходным кодом OLMo-7B-Instruct, построенную на наборе данных AI2 Dolma. Модель включает в себя полные веса четырех вариантов модели в масштабе 7B, каждый из которых обучен как минимум на маркерах 2T. Allen AI также выпустила оценочный комплект для использования при разработке, предоставляя коды обучения и оценки, позволяющие пользователям получить полное представление обо всем процессе, от моделей предварительного обучения до моделей точной настройки RLHF, обеспечивая надежную поддержку при разработке моделей. исследования и приложения.
Открытый исходный код OLMo-7B-Instruct не только предоставляет мощные модельные ресурсы, но, что более важно, полный вспомогательный код и инструменты оценки, что обеспечивает большое удобство для исследований и применения сообщества искусственного интеллекта и способствует разработке больших моделей. . Учитывая постоянное развитие и инновации, стоит рассчитывать на его эффективность в будущих приложениях.