국내 대형 모델들은 GPT-4를 뛰어넘는 방안을 적극적으로 모색하고 있다. 하지만 기존 평가 방식은 테스트 유출, 신뢰성 부족 등 한계가 있다. 대형모델에 대한 평가를 표준화하고 산업발전에 보다 신뢰할 수 있는 참고자료를 제공하기 위해서는 대형모델의 기술수준을 객관적이고 공정하게 평가하는 것이 중요하다. 이번 글에서는 국내 대형 모델의 개발 현황과 과제에 대해 논의해 본다.
국내 대형 모델들이 GPT4를 능가할 수 있는 방안을 모색하고 있으며, 다양한 평가 방법을 통해 대형 모델의 역량이 드러나고 있지만, 테스트 유출과 신뢰성에 대한 의구심이 존재한다. 중국정보통신기술학원(China Academy of Information and Communications Technology)은 대형 모델 평가에 대한 공식적이고 권위 있는 표준을 제공하기 위해 국가 표준 계획을 발표했습니다.
중국정보통신기술학원이 발표한 국가 표준 계획은 국내 대형 모델의 건전한 발전을 위한 중요한 보장을 제공하고 우리나라 대형 모델 평가 분야의 중요한 단계를 표시합니다. 앞으로도 더욱 완벽한 평가 시스템을 통해 국내 대형 모델의 기술 발전을 지속적으로 촉진하고 궁극적으로 경쟁을 달성하고 국제 선진 수준을 능가할 것입니다.