За пределами Джеммы2! IBM выпускает модель Granite3.1: поддерживает длину контекста 128 КБ

Автор：Eve Cole Время обновления：2024-12-25 20:00:02

IBM объявила о выпуске модели большого языка нового поколения с открытым исходным кодом Granite3.1, призванной стать лидером в области искусственного интеллекта корпоративного уровня. Granite3.1 имеет множество особенностей, в том числе увеличенную длину контекста до 128 КБ, эффективное встраивание моделей, встроенные возможности обнаружения галлюцинаций и значительно улучшенную общую производительность. По данным IBM, ее модель Granite8B Instruct работает лучше всего среди моделей с открытым исходным кодом того же масштаба, превосходя таких конкурентов, как Llama3.1 от Meta, Qwen2.5 и Gemma2 от Google. Выпуск этой новой модели последовал за запуском Granite 3.0 в октябре, что отражает быстрое развитие и постоянные инвестиции IBM в область генеративного искусственного интеллекта, при этом доход от соответствующего бизнеса достиг 2 миллиардов долларов США.

IBM официально выпустила новое поколение модели большого языка с открытым исходным кодом Granite3.1, стремясь занять лидирующие позиции в области искусственного интеллекта корпоративного уровня. Эта серия моделей отличается расширенной длиной контекста 128 КБ, встроенными моделями, встроенными возможностями обнаружения галлюцинаций и значительным улучшением производительности.

IBM утверждает, что модель Granite8B Instruct работает лучше всего среди конкурентов с открытым исходным кодом того же размера, включая Llama3.1 от Meta, Qwen2.5 и Gemma2 от Google.

Выпуск модели Granite3.1 происходит на фоне быстрой версии IBM серии Granite3.0, запущенной еще в октябре. IBM сообщила, что ее доход от бизнеса, связанного с созданием искусственного интеллекта, достиг 2 миллиардов долларов. Основная идея новой версии — интегрировать больше функций в меньшую модель, чтобы ее можно было использовать более легко и с меньшими затратами для бизнес-пользователей.

Дэвид Кокс, вице-президент IBM Research, заявил, что модель Granite широко используется во внутренних продуктах IBM, консалтинговых услугах и обслуживании клиентов, а также выпускается в форме с открытым исходным кодом, поэтому ей необходимо достичь высокого уровня во всех аспектах. Оценка производительности модели зависит не только от скорости, но и от эффективности, помогая пользователям экономить время при получении результатов.

Что касается длины контекста, улучшение Granite3.1 особенно очевидно: оно простирается от первой версии 4K до 128K, что особенно важно для корпоративных пользователей ИИ, особенно с точки зрения улучшенной генерации извлечения (RAG) и искусственного интеллекта интеллектуального агента. Расширенная длина контекста позволяет модели обрабатывать более длинные документы, журналы и разговоры, что позволяет ей лучше понимать сложные запросы и отвечать на них.

IBM также запустила серию моделей внедрения для ускорения процесса преобразования данных в векторы. Среди них время запроса модели Granite-Embedding-30M-English составляет 0,16 секунды, что быстрее, чем у продуктов конкурентов. Чтобы добиться повышения производительности Granite3.1, IBM внедрила инновации в многоэтапный процесс обучения и использование высококачественных обучающих данных.

Что касается обнаружения галлюцинаций, модель Granite3.1 включает в себя защиту от галлюцинаций, которая может самостоятельно обнаруживать и уменьшать ложные выходные данные. Это встроенное обнаружение оптимизирует общую эффективность и уменьшает количество вызовов вывода.

В настоящее время модель Granite3.1 открыта для корпоративных пользователей бесплатно и предоставляется через службу корпоративного искусственного интеллекта IBM Watsonx. В будущем IBM планирует поддерживать высокие темпы обновлений, а Granite 3.2 запустит мультимодальный функционал в начале 2025 года.

Официальный блог: https://www.ibm.com/new/announcements/ibm-granite-3-1-powerful- Performance-long-context-and-more

Выделять:

IBM запустила модель Granite3.1, стремясь занять лидирующие позиции на рынке моделей больших языков с открытым исходным кодом.

Новая модель поддерживает длину контекста 128 КБ, что значительно улучшает возможности и эффективность обработки.

Возможности обнаружения иллюзий интегрированы в модель, оптимизируя общую производительность и точность.

В целом, выпуск Granite3.1 знаменует собой еще один значительный прогресс для IBM в области моделей больших языков с открытым исходным кодом. Его высокая производительность и богатые функции обеспечат более удобный и эффективный опыт работы с искусственным интеллектом для корпоративных пользователей. Будущие итерации стоят того, чтобы их с нетерпением ждать.