Huazhong University of Science and Technology, ByteDance 및 Johns Hopkins University의 연구팀은 GLEE라는 범용 객체 수준 기본 모델을 공동으로 출시했습니다. 이번 획기적인 연구 결과는 기존 비전 기반 모델의 한계를 극복하고 이미지 및 영상 분석 분야에 새로운 가능성을 제시한다. GLEE 모델은 다양한 작업에서 잘 작동하며 특히 제로샷 전이 학습 시나리오에서 강력한 유연성과 일반화 기능을 보여줍니다. 자동으로 주석이 달린 대량의 데이터를 포함한 여러 데이터 소스를 통합하여 정확하고 보편적인 개체 수준 정보를 제공합니다.
GLEE는 특히 제로샷 전송 시나리오에서 유연성과 일반화 기능을 보여줌으로써 다양한 작업에서 잘 수행됩니다. 이 모델은 자동으로 레이블이 지정된 대용량 데이터를 포함하여 다양한 데이터 소스를 통합하여 정확하고 일반적인 객체 수준 정보를 제공합니다. 향후 연구 방향에는 복잡한 시나리오 및 롱테일 분산 데이터 세트 처리 기능을 확장하여 적응성을 향상시키는 것이 포함됩니다.
GLEE 모델의 출현은 비주얼 베이직 모델 분야에서 상당한 진전을 의미하며, 뛰어난 성능과 폭넓은 적용 가능성을 기대해 볼 가치가 있습니다. 앞으로 연구팀은 복잡한 장면과 롱테일 데이터에서 GLEE 모델의 적응성을 향상시키고, 적용 범위를 더욱 확장하며, 이미지 및 비디오 분석 기술에 더 넓은 영향을 미치기 위해 노력할 것입니다.