OpenAI는 최근 매우 기대되는 비디오 생성 모델인 Sora Turbo를 출시하여 2024년 생성 AI 분야에서 획기적인 발전을 이루었습니다. Sora Turbo는 비디오 생성 효율성과 지속 시간을 크게 향상시켰으며 텍스트, 사진 또는 비디오 프롬프트를 기반으로 최대 20초의 1080P 고화질 비디오를 생성할 수 있으며 슈퍼스코어, 슈퍼스코어 등 다양한 기능을 지원합니다. 프레임 및 HDR 게임 라인업 등 전체 게임 지원으로 사용자 경험이 크게 향상됩니다. 강력한 기능과 편리한 사용으로 인해 세계에서 가장 높은 세대 시간을 가진 비디오 모델 중 하나가 되었습니다.
OpenAI는 오늘 생방송에서 매우 기대되는 제품인 Sora Turbo를 출시하여 2024년 생성 AI 분야에 획기적인 진전을 이루었습니다. Sora Turbo의 생성 효율이 크게 향상되었으며, 텍스트에서 최대 20초의 1080P 비디오를 직접 생성할 수 있어 세계에서 생성 시간이 가장 긴 비디오 모델 중 하나가 되었습니다. 이 모델은 특정 비디오 콘텐츠를 생성하기 위해 텍스트와 그림 또는 비디오의 입력을 지원하므로 생성 효과를 보다 쉽게 제어할 수 있습니다.
Sora Turbo의 기술적 하이라이트에는 슈퍼스코어, 슈퍼프레임 및 HDR 게임 라인업에 대한 전체 게임 지원과 독립 그래픽을 기반으로 자체 개발한 두 가지 기능 업그레이드가 포함됩니다. 그 중 터치 동적 프레임 삽입 기능은 프레임 삽입의 정확성을 크게 향상시키고 사진 손상을 줄일 수 있습니다. 게임의 어두운 밤 모드는 AI 알고리즘을 사용하여 어두운 디테일을 개선하고 어두운 영역의 시각 효과를 향상시키는 동시에 플레이의 밝기 문제를 해결합니다. 어두운 조명 환경에서의 게임.
현재 Sora는 무제한 사용 단계에 진입했습니다. ChatGPT Plus 및 Pro 회원의 경우 Sora 사용에 따른 추가 비용이 없습니다. OpenAI는 또한 새로운 UI를 개발하고 커뮤니티 공유 서비스를 제공하여 사용자가 자신이 생성한 비디오를 공유하거나 다른 사람의 즉각적인 효과를 통해 학습하여 작업을 개선할 수 있습니다.
소라의 기술 원리에는 대용량 이미지 및 영상 데이터에 대한 집중적인 훈련이 가능한 패치 적용, 영상 데이터의 차원성을 줄이고 출력 품질을 향상시키는 영상 압축 네트워크 적용이 포함됩니다.
Sora는 또한 전통적인 U-Net 아키텍처를 대체하는 혁신적인 확산 변환기 방법을 사용하여 확산 모델과 변환기 아키텍처를 통합하여 입력 이미지와 텍스트 레이블 간의 분포 관계를 캡처하는 기능을 효과적으로 향상시킵니다. 또한 Sora는 DALL・E3의 재자막 기술을 도입하여 설명성이 뛰어난 자막 모델을 훈련하여 훈련 세트의 모든 비디오에 대한 텍스트 자막을 생성함으로써 텍스트의 충실도와 비디오의 전반적인 품질을 향상시켰습니다.
체험주소 : https://sora.com/
소라 터보의 등장은 AI 영상 생성의 효율성과 품질을 향상시킬 뿐만 아니라 사용자에게 더욱 편리하고 강력한 크리에이티브 도구를 제공합니다. OpenAI의 개방형 정책과 커뮤니티 공유 기능은 AI 기술의 대중화와 발전을 더욱 촉진합니다. 저는 Sora Turbo가 앞으로 AI 비디오 생성 분야에서 더 큰 역할을 하고 사용자들에게 더 많은 놀라움을 선사할 것이라고 믿습니다.