El editor de Downcodes conoció que H2O.ai lanzó recientemente dos nuevos modelos de lenguaje visual: H2OVL Mississippi-2B y H2OVL-Mississippi-0.8B, con el objetivo de revolucionar la eficiencia del análisis de documentos y las tareas de OCR. Ambos modelos se comparan favorablemente en rendimiento con los productos de las principales empresas de tecnología, lo que brinda a las empresas soluciones de procesamiento de documentos más rentables. Lo que es particularmente digno de mención es que el modelo H2OVL Mississippi-0.8B con solo 800 millones de parámetros superó a la multitud en la tarea de reconocimiento de texto OCRBench, superando a muchos productos de la competencia con docenas de veces más parámetros, lo que demuestra el enorme potencial del rendimiento de los modelos pequeños.
Recientemente, H2O.ai anunció el lanzamiento de dos nuevos modelos de lenguaje visual diseñados para mejorar la eficiencia del análisis de documentos y las tareas de reconocimiento óptico de caracteres (OCR). Los dos modelos, H2OVL Mississippi-2B y H2OVL-Mississippi-0.8B, tienen un rendimiento impresionantemente competitivo con los modelos de las grandes empresas de tecnología y ofrecen potencialmente una solución más eficiente para las empresas que manejan flujos de trabajo con muchos documentos.
Aunque el modelo H2OVL Mississippi-0.8B solo tiene 800 millones de parámetros, supera a todos los demás modelos en la tarea de reconocimiento de texto OCRBench, incluidos los competidores con miles de millones de parámetros. El modelo H2OVL Mississippi-2B de 2 mil millones de parámetros tuvo un buen desempeño en múltiples pruebas de lenguaje visual.
Sri Ambati, fundador y director ejecutivo de H2O.ai, dijo en una entrevista: "Diseñamos el modelo H2OVL Mississippi para que sea una solución rentable y de alto rendimiento para proporcionar OCR impulsado por IA, comprensión visual a diversas industrias y IA de documentos. "
Enfatizó que estos modelos pueden funcionar eficientemente en una variedad de entornos y pueden ajustarse según las necesidades de áreas específicas, ayudando así a las empresas a reducir costos y mejorar la eficiencia.
H2O.ai lanzó estos dos nuevos modelos de forma gratuita en la plataforma Hugging Face, lo que permite a los desarrolladores y empresas modificar y adaptar los modelos según sus propias necesidades. Este movimiento no solo amplía la base de usuarios de H2O.ai, sino que también brinda más opciones para las empresas que desean adoptar soluciones de inteligencia artificial para documentos.
Al mismo tiempo, Ambati también señaló que no se pueden ignorar las ventajas económicas de los modelos pequeños construidos específicamente. "Nuestro modelo de transformador generativo preentrenado se basa en una cooperación profunda con los clientes y está diseñado para extraer información significativa de los documentos empresariales". Señaló que el modelo de H2O.ai puede proporcionar una alta eficiencia y consumir menos recursos. especialmente cuando se enfrenta a escaneos de mala calidad, escritura ilegible o documentos muy modificados.
Entrada de modelo:
H2OVL-Mississippi-0.8B: https://huggingface.co/h2oai/h2ovl-mississippi-800m
H2OVL Misisipi-2B: https://huggingface.co/h2oai/h2ovl-mississippi-2b
Destacar:
H2O.ai lanza los nuevos modelos de lenguaje visual H2OVL Mississippi-2B y H2OVL-Mississippi-0.8B para brindar soluciones eficientes de análisis de documentos.
El modelo H2OVL Mississippi-0.8B supera a competidores más grandes en tareas de reconocimiento de texto, lo que demuestra el potencial de los modelos pequeños.
H2O.ai está comprometido con soluciones de IA prácticas y de código abierto para ayudar a las empresas a extraer información valiosa durante la transformación digital.
Estos dos nuevos modelos de H2O.ai han sido de código abierto en la plataforma Hugging Face, y los desarrolladores y empresas interesados pueden obtenerlos y utilizarlos de forma gratuita. Esto sin duda acelerará la popularización y aplicación de la tecnología de inteligencia artificial de documentos. El editor de Downcodes espera ver más aplicaciones innovadoras basadas en estos dos modelos.