중국 연구팀은 주요 획기적인 혁신을했으며이를 기반으로 가장 큰 공개 멀티 모드 AI 데이터 세트 "Infinity-MM"을 성공적으로 만들었으며 우수한 성능 Aquila-VL-2B로 작은 모델을 교육했습니다. 이 데이터 세트에는 GPT-4와 같은 AI 모델에서 생성 된 대규모 이미지 설명, 시각적 명령 데이터 및 데이터가 포함되어 있습니다. Aquila-VL-2B 모델은 20 억 개의 매개 변수로 여러 벤치 마크 테스트에서 탁월한 결과를 얻었지만 MMSTAR BASIC 테스트에서는 54.9%가 높으며 수학 및 이미지 이해 작업에서도 뛰어납니다 합성 데이터를 효과적으로 사용하면 모델 성능이 2.4%향상되었습니다. 더 중요한 것은 데이터 세트와 모델이 연구 커뮤니티에 열려 오픈 소스 AI의 개발을 주도했습니다.
이 연구 결과는 중국의 다중 모드 AI 분야에서 크게 진전을 이루고 Aquila-VL-2B의 성공과 Infinity-MM 데이터 세트의 개방은 Global AI Research 커뮤니티에 귀중한 자원을 제공하여 멀티 모달 AI 추가 개발 및 기술 적용을 홍보 할 것입니다. . Infinity-MM Paper 및 Aquila-VL-2B 프로젝트를 사용할 수 있습니다. 관련 링크를 방문하여 자세한 내용을 확인하십시오.