Команда «Объятие лица» выпустило две легкие модели ИИ: Smolvlm-256M и Smolvlm-500M, с параметрами 256 миллионов и 500 миллионов соответственно. Эти две модели особенно подходят для устройств с менее чем 1 ГБ памяти, предоставляя разработчикам недорогие и высокоэффективные решения для обработки данных. Его эффективная производительность превышает многие масштабные модели в различных показателях, особенно в отношении работы с научными чартами начальной школы, демонстрируя его огромный потенциал в образовании и исследованиях.
Недавно команда Hugging Face, платформа разработки искусственного интеллекта, выпустила две новые модели AI, Smolvlm-256M и Smolvlm-500M. Они с уверенностью утверждают, что две модели являются самыми маленькими моделями ИИ, способными обрабатывать изображения, короткие видео и текстовые данные одновременно, особенно подходящие для устройств с менее чем 1 ГБ памяти, такие как ноутбуки. Это инновация позволяет разработчикам достигать более высокой эффективности при более низких затратах при обработке больших объемов данных.
Параметры этих двух моделей составляют 256 миллионов и 500 миллионов соответственно, что означает, что их способность решать проблемы также улучшилась соответственно. Задачи, которые может выполнять сериал Smolvlm, включают описание изображений или видеоклипов и ответные вопросы о документах PDF и их содержании, таких как сканирующий текст и диаграммы. Это заставляет их иметь широкий спектр перспектив применения во многих областях, таких как образование и исследования.
Во время подготовки модели команда объятий обнимала 50 высококачественных наборов данных и текстовых данных, называемых «The Cauldron», а также сканирование файлов и подробные наборы спаривания DocMatix. Оба набора данных были разработаны путем обнимания команды M4 Face и сфокусированы на разработке мультимодальной технологии ИИ. Стоит отметить, что SMOLVLM-256M и SMOLVLM-500M превосходят многие более крупные модели в различных эталонных тестах, таких как IDEFICS80B, и особенно в тестах AI2D, они проводят превосходство в способности анализировать научные графики для учащихся начальных школ.
Однако, хотя и доступны и универсальны, небольшие модели могут работать не так же хорошо, как большие модели по сложным задачам. Исследование Google DeepMind, Microsoft Research Institute и Института Мила в Квебеке показало, что многие небольшие модели выполняли разочарование в этих сложных задачах. Исследователи предполагают, что это может быть связано с тенденцией небольших моделей идентифицировать поверхностные особенности данных, и они, по -видимому, являются недобросовестными при применении этих знаний в новых ситуациях.
Семейство моделей SMOLVLM об объятиях Face - это не только небольшие инструменты искусственного интеллекта, но и демонстрируют впечатляющие возможности при работе с различными задачами. Это, несомненно, является хорошим выбором для разработчиков, которые хотят достичь эффективной обработки данных при низких затратах.
Появление серии моделей Smolvlm принесло новые возможности для легких приложений искусственного интеллекта. Несмотря на то, что все еще есть место для улучшения сложных задач, его низкий порог и высокая эффективность делают его выбором, который многие разработчики заслуживают внимания. В будущем мы с нетерпением ждем возможности увидеть приложение и дальнейшую оптимизацию моделей Smolvlm Series в большем количестве областей.