Downcodes エディターのレポート: OpenBMB のこの 8B パラメーター マルチモーダル エンドサイド モデルである MiniCPM-V2.6 は、最近 GitHub と Hugging Face で素晴らしい結果を達成し、トップ 3 にランクされ、GitHub スターの数は 10,000 を超えました。そしてダウンロード数は100万件を突破しました!単一画像、複数画像、ビデオ理解の点で GPT-4V を総合的に上回り、リアルタイムビデオ理解や複数画像共同理解などのハイエンド機能を初めて統合します。その効率的なパフォーマンスと便利な展開方法により、エンドサイド モデルの機能の限界を測る重要な尺度となり、世界のテクノロジー界で幅広い注目を集めています。
MiniCPM-V シリーズの最新バージョン 2.6 は、リリース以来、世界有数のオープンソース コミュニティである GitHub および HuggingFace のトレンド リストですぐにトップ 3 に浮上し、GitHub スターの数は 10,000 を超えました。 2 月 1 日のデビュー以来、MiniCPM シリーズは 100 万回以上ダウンロードされており、クライアント側モデルの機能の限界を測る重要な尺度となっています。
MiniCPM-V2.6 は、8B パラメーターにより、単一画像、複数画像、およびビデオの理解において総合的なパフォーマンスの向上を達成し、GPT-4V を上回ります。このエンドサイドマルチモーダルモデルには、リアルタイムビデオ理解、複数画像共同理解、複数画像 ICL などのハイエンド機能が初めて統合されています。量子化されたバックエンド側で占有するメモリは 6 GB のみで、エンド側の推論速度は 18 トークン/秒と高く、前世代モデルよりも 33% 高速です。llama.cpp、ollama、vllm をサポートしています。推論をサポートし、複数の言語をサポートします。
この技術的進歩は世界の技術界で熱狂的な反応を引き起こし、多くの開発者やコミュニティ メンバーが MiniCPM-V2.6 のリリースに大きな関心を示しています。
現時点では、MiniCPM-V2.6 の GitHub および Hugging Face オープン ソース アドレスが公開されており、llama.cpp、ollama、および vllm の展開チュートリアルへのリンクが提供されています。
MiniCPM-V2.6GitHub オープンソース アドレス:
https://github.com/OpenBMB/MiniCPM-V
MiniCPM-V2.6Hugging Face オープンソース アドレス:
https://huggingface.co/openbmb/MiniCPM-V-2_6
llama.cpp、ollam、vllm 展開チュートリアルのアドレス:
https://modelbest.feishu.cn/docx/Duptdntfro2Clfx2DzuczHxAnhc
MiniCPM-V2.6 のオープンソースは、開発者に強力なツールと便利な導入チュートリアルを提供し、将来的にはエンドサイドのマルチモーダル モデル テクノロジーの開発を促進し、より多くのアプリケーション シナリオに革新的な可能性をもたらすと考えられています。今後もダウンコード編集部は今後の展開に注目していきますので、ご期待ください!