Editor Downcodes mengetahui bahwa H2O.ai baru-baru ini meluncurkan dua model bahasa visual baru: H2OVL Mississippi-2B dan H2OVL-Mississippi-0.8B, yang bertujuan untuk merevolusi efisiensi analisis dokumen dan tugas OCR. Kedua model ini memiliki kinerja yang lebih baik dibandingkan produk dari perusahaan teknologi besar, sehingga memberikan solusi pemrosesan dokumen yang lebih hemat biaya bagi bisnis. Hal yang patut diperhatikan adalah bahwa model H2OVL Mississippi-0.8B dengan hanya 800 juta parameter mengungguli banyak orang dalam tugas pengenalan teks OCRBench, melampaui banyak produk pesaing dengan parameter puluhan kali lebih banyak, menunjukkan kinerja model kecil.
Baru-baru ini, H2O.ai mengumumkan peluncuran dua model bahasa visual baru yang dirancang untuk meningkatkan efisiensi tugas analisis dokumen dan pengenalan karakter optik (OCR). Kedua model tersebut, H2OVL Mississippi-2B dan H2OVL-Mississippi-0.8B, memiliki performa yang sangat bersaing dengan model dari perusahaan teknologi besar, sehingga berpotensi menawarkan solusi bagi bisnis yang menangani alur kerja yang banyak dokumen.
Meskipun model H2OVL Mississippi-0.8B hanya memiliki 800 juta parameter, model ini melampaui semua model lain dalam tugas pengenalan teks OCRBench, termasuk pesaing dengan miliaran parameter. Model H2OVL Mississippi-2B dengan 2 miliar parameter berkinerja baik dalam berbagai tolok ukur bahasa visual.
Sri Ambati, pendiri dan CEO H2O.ai, mengatakan dalam sebuah wawancara: "Kami merancang model H2OVL Mississippi untuk menjadi solusi berkinerja tinggi dan hemat biaya untuk memberikan OCR berbasis AI, pemahaman visual ke berbagai industri dan AI Dokumen. ”
Dia menekankan bahwa model-model ini dapat berjalan secara efisien di berbagai lingkungan dan dapat disesuaikan dengan kebutuhan area tertentu, sehingga membantu perusahaan mengurangi biaya dan meningkatkan efisiensi.
H2O.ai merilis dua model baru ini secara gratis di platform Hugging Face, memungkinkan pengembang dan perusahaan untuk memodifikasi dan mengadaptasi model sesuai dengan kebutuhan mereka. Langkah ini tidak hanya memperluas basis pengguna H2O.ai, namun juga memberikan lebih banyak pilihan bagi perusahaan yang ingin mengadopsi solusi AI dokumen.
Pada saat yang sama, Ambati juga mencatat bahwa keuntungan ekonomi dari model kecil yang dibuat khusus tidak dapat diabaikan. “Model trafo terlatih generatif kami didasarkan pada kerja sama mendalam dengan pelanggan dan dirancang untuk mengekstrak informasi bermakna dari dokumen perusahaan.” Dia menunjukkan bahwa model H2O.ai dapat memberikan efisiensi tinggi sekaligus mengonsumsi lebih sedikit sumber daya. terutama ketika dihadapkan pada hasil pindaian berkualitas buruk, tulisan tangan yang tidak terbaca, atau dokumen yang banyak dimodifikasi.
Entri model:
H2OVL-Mississippi-0.8B:https://huggingface.co/h2oai/h2ovl-mississippi-800m
H2OVL Mississippi-2B: https://huggingface.co/h2oai/h2ovl-mississippi-2b
Menyorot:
H2O.ai meluncurkan model bahasa visual baru H2OVL Mississippi-2B dan H2OVL-Mississippi-0.8B untuk memberikan solusi analisis dokumen yang efisien.
Model H2OVL Mississippi-0.8B mengungguli pesaing yang lebih besar dalam tugas pengenalan teks, sehingga menunjukkan potensi model kecil.
H2O.ai berkomitmen terhadap solusi AI open source dan praktis untuk membantu perusahaan mengekstrak informasi berharga selama transformasi digital.
Kedua model baru H2O.ai ini telah bersumber terbuka pada platform Hugging Face, dan pengembang serta perusahaan yang tertarik dapat memperoleh dan menggunakannya secara gratis. Hal ini tidak diragukan lagi akan mempercepat mempopulerkan dan penerapan teknologi AI dokumen. Editor Downcodes berharap dapat melihat lebih banyak aplikasi inovatif berdasarkan kedua model ini.