Huake University of Science and Technology, 다중 모드 대형 모델의 성능 평가를 위한 새로운 벤치마크 출시
화중과기대학교와 기타 기관은 5가지 주요 작업과 27개 데이터 세트를 다루는 다중 모드 대형 모델에 대한 새로운 벤치마크를 발표했습니다. 평가 결과, 텍스트 인식, 문서 질문 답변 등의 작업에서는 우수한 성능을 보였지만, 의미 의존성, 필기 텍스트, 다국어 텍스트에서는 어려움이 있습니다. 연구팀은 OCR 기능을 보다 정확하게 평가하고 다중 모드 대형 모델 개발을 위한 플랫폼을 제공하기 위해 OCRBench를 구축했습니다.
2025-02-01