Alibaba가 새로 출시한 QVQ-72B 다중 모드 추론 모델은 Qwen2-VL-72B를 기반으로 구축되었으며 시각적 추론, 수학 및 과학 문제에서 탁월한 성능을 보여줍니다. 언어와 시각적 정보를 융합하고 다단계 추론을 수행하며 복잡한 문제를 해결할 수 있으며, 특히 물리적 문제와 복잡한 수학적 추론의 인과 관계 도출에 탁월하여 오류율을 크게 줄이고 명확한 문제 해결 단계를 제공합니다. QVQ-72B는 또한 기술 보고서 처리 및 복잡한 차트 분석에서 핵심 정보를 추출하는 효율적이고 정확한 능력을 입증하며, 정확한 이미지 세부 인식 기능을 갖추고 있어 지능형 모니터링, 자율 주행 등의 분야에 적용할 수 있습니다.
QVQ-72B는 다중 모드 AI 분야에서 획기적인 발전을 이루었습니다. 강력한 추론 기능은 복잡한 문제를 해결하기 위한 새로운 아이디어와 도구를 제공하여 다양한 산업의 지능적 업그레이드에 새로운 추진력을 불어넣습니다. 온라인 체험판 및 자세한 소개 링크는 https://huggingface.co/spaces/Qwen/QVQ-72B-preview 및 https://qwenlm.github.io/blog/qvq-72b-preview/입니다. QVQ-72B의 등장으로 더 많은 분야에서 인공지능 기술의 적용과 발전이 촉진될 것으로 기대된다.