Редактор Downcodes узнал, что H2O.ai недавно запустил две новые модели визуального языка: H2OVL Mississippi-2B и H2OVL-Mississippi-0.8B, стремясь революционизировать эффективность анализа документов и задач оптического распознавания символов. Обе модели выгодно отличаются по производительности от продуктов крупных технологических компаний, предоставляя предприятиям более экономичные решения для обработки документов. Что особенно примечательно, так это то, что модель H2OVL Mississippi-0.8B, имеющая всего 800 миллионов параметров, обогнала толпу в задаче распознавания текста OCRBench, превзойдя многие конкурирующие продукты с в десятки раз большим количеством параметров, показав огромный потенциал производительности небольших моделей.
Недавно H2O.ai объявил о запуске двух новых моделей визуального языка, предназначенных для повышения эффективности задач анализа документов и оптического распознавания символов (OCR). Две модели, H2OVL Mississippi-2B и H2OVL-Mississippi-0.8B, впечатляюще конкурируют по производительности с моделями крупных технологических компаний и потенциально предлагают решение для предприятий, работающих с большим количеством документов. Более эффективное решение.
Хотя модель H2OVL Mississippi-0.8B имеет всего 800 миллионов параметров, в задаче распознавания текста OCRBench она превосходит все остальные модели, включая конкурентов с миллиардами параметров. Модель H2OVL Mississippi-2B с 2 миллиардами параметров показала хорошие результаты в нескольких тестах визуального языка.
Шри Амбати, основатель и генеральный директор H2O.ai, сказал в интервью: «Мы разработали модель H2OVL для Миссисипи, чтобы она стала высокопроизводительным и экономически эффективным решением для обеспечения оптического распознавания символов на основе искусственного интеллекта, визуального понимания для различных отраслей и искусственного интеллекта для документов. »
Он подчеркнул, что эти модели могут эффективно работать в различных средах и могут быть точно настроены в соответствии с потребностями конкретных областей, тем самым помогая предприятиям сократить расходы и повысить эффективность.
H2O.ai бесплатно выпустила эти две новые модели на платформе Hugging Face, что позволяет разработчикам и предприятиям модифицировать и адаптировать модели в соответствии со своими потребностями. Этот шаг не только расширяет базу пользователей H2O.ai, но и предоставляет больше возможностей предприятиям, которые хотят внедрить решения искусственного интеллекта для документов.
В то же время Амбати также отметил, что нельзя игнорировать экономические преимущества небольших, специально построенных моделей. «Наша генеративная модель предварительно обученного преобразователя основана на углубленном сотрудничестве с клиентами и предназначена для извлечения значимой информации из корпоративных документов». Он отметил, что модель H2O.ai может обеспечить высокую эффективность, потребляя при этом меньше ресурсов для обработки документов. особенно когда вы сталкиваетесь с некачественными сканами, неразборчивым почерком или сильно измененными документами.
Запись модели:
H2OVL-Миссисипи-0.8B: https://huggingface.co/h2oai/h2ovl-mississippi-800m
H2OVL Миссисипи-2B: https://huggingface.co/h2oai/h2ovl-mississippi-2b
Выделять:
H2O.ai запускает новые модели визуального языка H2OVL Mississippi-2B и H2OVL-Mississippi-0.8B для предоставления эффективных решений для анализа документов.
Модель H2OVL Mississippi-0.8B превосходит более крупных конкурентов в задачах распознавания текста, демонстрируя потенциал небольших моделей.
H2O.ai стремится предлагать практические решения искусственного интеллекта с открытым исходным кодом, которые помогают предприятиям извлекать ценную информацию в ходе цифровой трансформации.
Эти две новые модели H2O.ai были открыты на платформе Hugging Face, и заинтересованные разработчики и предприятия могут получить и использовать их бесплатно. Это, несомненно, ускорит популяризацию и применение технологии искусственного интеллекта для документов. Редактор Downcodes с нетерпением ожидает появления новых инновационных приложений, основанных на этих двух моделях.