다운코드 편집자 보고서: OpenBMB의 이 8B 매개변수 다중 모달 최종 측 모델인 MiniCPM-V2.6은 최근 GitHub 및 Hugging Face에서 인상적인 결과를 달성하여 상위 3위 안에 들었고 GitHub 별 수가 10,000개를 초과했습니다. 그리고 다운로드 수가 100만 건을 돌파했습니다! 단일 이미지, 다중 이미지, 비디오 이해 측면에서 GPT-4V를 종합적으로 능가하며, 실시간 비디오 이해, 다중 이미지 공동 이해 등 고급 기능을 최초로 통합했습니다. 효율적인 성능과 편리한 배포 방법은 최종 모델 기능의 한계를 측정하는 중요한 척도가 되며, 이는 글로벌 기술계에서 광범위한 관심을 끌고 있습니다.
MiniCPM-V 시리즈의 최신 버전 2.6은 출시 이후 세계 최고의 오픈소스 커뮤니티인 GitHub와 HuggingFace의 트렌드 목록에서 빠르게 Top 3에 올랐으며, GitHub 스타 수가 10,000명을 넘었습니다. MiniCPM 시리즈는 2월 1일 출시 이후 100만 회 이상 다운로드되었으며 클라이언트 측 모델 기능의 한계를 나타내는 중요한 척도가 되었습니다.
MiniCPM-V2.6은 8B 매개변수를 통해 단일 이미지, 다중 이미지 및 비디오 이해에서 GPT-4V를 능가하는 포괄적인 성능 향상을 달성합니다. 이 엔드사이드 다중 모드 모델은 실시간 비디오 이해, 다중 이미지 공동 이해, 다중 이미지 ICL과 같은 고급 기능을 최초로 통합합니다. 양자화된 백엔드 측에서는 6GB의 메모리만 차지하며, 엔드 측 추론 속도는 18개 토큰/초로 이전 세대 모델보다 33% 빠릅니다. llama.cpp, ollama, vllm을 지원합니다. 추론하고 여러 언어를 지원합니다.
이러한 기술적 혁신은 글로벌 기술계에서 뜨거운 반응을 불러일으켰으며, 많은 개발자와 커뮤니티 구성원이 MiniCPM-V2.6 출시에 큰 관심을 보였습니다.
현재 MiniCPM-V2.6의 GitHub 및 Hugging Face 오픈 소스 주소가 공개되었으며 llama.cpp, ollama 및 vllm 배포 튜토리얼에 대한 링크가 제공되었습니다.
MiniCPM-V2.6GitHub 오픈 소스 주소:
https://github.com/OpenBMB/MiniCPM-V
MiniCPM-V2.6Hugging Face 오픈 소스 주소:
https://huggingface.co/openbmb/MiniCPM-V-2_6
llama.cpp, ollama, vllm 배포 튜토리얼 주소:
https://modelbest.feishu.cn/docx/Duptdntfro2Clfx2DzuczHxAnhc
MiniCPM-V2.6의 오픈 소스는 개발자에게 강력한 도구와 편리한 배포 튜토리얼을 제공하여 향후 최종 다중 모드 모델 기술의 개발을 촉진하고 더 많은 애플리케이션 시나리오에 혁신적인 가능성을 가져올 것으로 믿어집니다. Downcodes의 편집자는 계속해서 후속 진행 상황에 주의를 기울일 예정이므로 계속 지켜봐 주시기 바랍니다!