충격이 온다! Open-Sora Plan v1.2 출시, 명확성과 추론 속도 도약

저자：Eve Cole 업데이트 시간：2024-12-14 10:32:01

Open-Sora 플랜 v1.2가 출시되었습니다! 이번 업데이트는 혁신적인 업그레이드를 제공하며, 그 핵심은 AI가 물리적 세계를 이해하는 방식을 완전히 바꾸고 평면에서 3차원으로 도약하는 새로운 3D 완전 주의 아키텍처에 있습니다. 물리적 세계를 이해하는 능력이 크게 향상되었을 뿐만 아니라, 생성된 영상의 명확성과 일관성도 향상되었습니다. 대폭 최적화되었으며 추론 속도가 훨씬 더 높아졌습니다. Open-Sora Plan v1.2의 세부 업데이트 내용을 살펴보겠습니다.

Open-Sora 플랜이 다시 업그레이드되었습니다! Open-Sora 플랜 v1.2의 최신 버전은 물리적 세계에 대한 이해를 향상시키는 새로운 3D 풀 어텐션 아키텍처를 도입합니다.

이번 업데이트의 주요 하이라이트:

새로운 3D 완전 주의 아키텍처: 새로운 아키텍처를 통해 AI는 물리적 세계를 이해하는 데 있어 질적인 도약을 이룰 수 있습니다. 더 이상 2차원으로만 생각할 수 있는 QR코드가 아니라, 이제 이 3차원 세계를 사각지대 없이 360도 이해할 수 있습니다!

업그레이드된 텍스트 생성 비디오 기능: 텍스트를 입력하면 AI가 실제와 같은 비디오 사진을 제공할 수 있습니다.

향상된 선명도 및 일관성: 새로운 아키텍처와 최적화된 VAE 구조를 통해 Open-Sora에서 생성된 비디오 품질은 더욱 명확해지고 콘텐츠는 더욱 일관됩니다. 모호함은 이제 안녕!

공간과 시간의 완벽한 통합: 새로운 3D Full Attention 아키텍처는 공간과 시간 차원을 동시에 처리하는 이전 버전의 주요 문제를 해결합니다. 이는 생성된 비디오가 공간적 성능과 시간적 유창성 측면에서 크게 향상된다는 것을 의미합니다!

추론 속도가 크게 향상되었습니다. 최적화된 CausalVideoVAE 구조는 모델의 성능을 향상시킬 뿐만 아니라 추론 속도도 급상승시킵니다. 효율성 파티를 응원합니다!

Open-Sora의 개발 역사를 되돌아보면 그 발전은 놀라울 정도입니다. 최근 2024년 5월까지 v1.1.0 버전은 주로 탐색 훈련에 사용되는 2+1D 모델 아키텍처를 여전히 사용하고 있었습니다. 그리고 불과 몇 달이 지난 지금, 3D 세계를 창조할 수 있는 창조자로 진화했습니다! 이 속도로, 다윈조차도 외쳤을 것입니다: 진화론이 곧 다시 쓰여질 것입니다!

가장 멋진 점은 Open-Sora 팀이 아무것도 숨기지 않는다는 것입니다! 코드, 데이터, 모델이 모두 오픈 소스이며, 세상을 만드는 방법에 대한 지침을 여러분의 얼굴에 그대로 담고 있습니다. 그들의 목표는 간단합니다. 모두가 비디오 제작의 신이 되도록 하는 것입니다. 이러한 개방적이고 공유하는 태도는 의심할 여지 없이 AI 비디오 생성 기술의 발전을 가속화할 것입니다.

Open-Sora Plan v1.2.0의 출시는 비디오 생성 모델의 새로운 시대를 열었습니다. 시각적 표현 압축 및 추론 효율성을 크게 향상시킬 뿐만 아니라 향후 발전 방향을 제시합니다.

프로젝트 주소: https://top.aibase.com/tool/open-sora-plan-v1-2

Open-Sora Plan v1.2의 출시는 AI 영상 생성 기술이 새로운 개발 단계에 진입했음을 알리고, 오픈 소스 기능도 기술 발전을 위한 강력한 추진력을 제공합니다. 앞으로 Open-Sora가 가져올 더 많은 놀라움을 기대합니다!