최근 뉴욕대학교, MIT, Google 연구팀은 확산 모델의 추론 시간 병목 현상 문제를 해결하기 위해 설계된 혁신적인 프레임워크를 제안하는 획기적인 연구를 발표했습니다. 이 프레임워크는 검증인 피드백과 잡음이 있는 후보 검색 알고리즘을 교묘하게 결합하여 고정된 수의 잡음 제거 단계를 유지하면서 추가 컴퓨팅 리소스를 도입함으로써 생성 모델의 성능을 크게 향상시킵니다. 본 연구는 여러 벤치마크 테스트에서 우수한 결과를 얻었을 뿐만 아니라, 시각적 생성 작업을 위한 보다 전문화된 검증 시스템의 향후 개발을 위한 귀중한 참고 자료를 제공했습니다.
프레임워크는 주로 피드백을 제공하기 위한 검증기를 도입하고 더 나은 노이즈 후보를 발견하기 위한 알고리즘을 구현함으로써 구현됩니다. 연구팀은 Inception Score와 Fréchet Inception Distance를 검증자로 활용하고, 사전 훈련된 SiT-XL 모델을 기반으로 실험을 진행했습니다. 실험 결과에 따르면 이 방법은 샘플 품질을 효과적으로 향상시키며 특히 ImageReward 및 Verifier Ensemble에서 상당한 진전을 달성하는 것으로 나타났습니다.
실험 결과에 따르면 프레임워크는 여러 벤치마크에서 잘 작동하는 것으로 나타났습니다. DrawBench 테스트에서 LLM Grader 평가를 통해 검색 검증 방법이 지속적으로 샘플 품질을 향상시킬 수 있음을 확인했습니다. 특히 ImageReward와 Verifier Ensemble은 정확한 평가 기능과 인간 선호도와의 높은 일관성 덕분에 다양한 지표에서 상당한 개선을 이루었습니다.
본 연구는 검색 기반 계산 확장 방법의 효율성을 확인할 뿐만 아니라 다양한 검증자의 고유한 편견을 밝혀 시각적 생성 작업을 위한 보다 전문화된 검증 시스템의 향후 개발 방향을 제시합니다. 이번 발견은 AI 생성 모델의 전반적인 성능을 향상시키는 데 큰 의미가 있습니다.
이 연구는 확산 모델의 추론 효율성을 향상시키기 위한 새로운 아이디어를 제공하며, 제안된 프레임워크와 방법은 향후 AI 생성 모델 개발을 위한 중요한 참조 가치를 제공하며 보다 효율적이고 높은 품질을 예고합니다. AI 이미지 생성 기술이 온다.