최근 OpenAi는 매력적인 뉴스를 발표했습니다. 내부 테스트 프로젝트 인 SORA는 시작된 비디오 생성 기능 외에도 이미지 생성 기능도 본격적으로 개발되고 있습니다. 이 새로운 기능을 통해 사용자는 비디오 생성과 이미지 생성을 빠르게 전환하여 창의적인 유연성을 향상시킬 수 있습니다.
내부 메시지에 따르면 SORA는 숨겨진 토글 버튼을 추가하고 사용자는 프롬프트 막대를 선택하여 두 모드를 전환 할 수 있습니다. 이미지 생성을 선택할 때 시스템은 사용자에게 이미지를 설명하라는 메시지를 자동으로 프롬프트합니다. 이 디자인은 사용자 운영을 단순화하고 생성 된 컨텐츠의 관련성과 품질을 향상 시키도록 설계되었습니다.
Sora는 이미지 생성 기능의 개선 외에도 비디오 푸시를 재 분류했습니다. 새로 출시 된 "Best"및 "Top"카테고리는 사용자가 더 나은 필터를 필터링하고 컨텐츠를 찾는 데 도움이됩니다. "가장 좋은"카테고리는 현재 주요 채널과 유사하지만 "Top"카테고리는 사용자 또는 기간의 좋아요 수를 기준으로 비디오를 평가할 수 있습니다. 이 카테고리의 변화는 사람들이 SORA의 내용 추천 메커니즘을 기대합니다.
Dall-E3 사용자의 경우 Dall-E3가 출시 이후, 특히 Midjourney와 같은 경쟁 업체와 비교할 때 다소 구식이 되었기 때문에 뉴스는 의심 할 여지없이 흥미 롭습니다. SORA의 이미지 생성 기능은 아직 공식적으로 시작되지 않았지만 왼쪽 탐색 표시 줄의 "이미지 내부"범주는 사용자의 호기심을 불러 일으켰습니다. 이 범주는 현재 비디오 푸시에 주로 사용되지만 향후 이미지 생성과 관련된 컨텐츠를 제공 할 수도 있습니다.
어떤 사람들은이 이미지 생성 모델이 Dall-E4라고 할 수 있다고 추측하지만 OpenAi는 아직 확인하지 않았습니다. 업계 전문가들은 SORA의 이미지 생성기가 Dall-E4를 직접 사용하지는 않지만 기존의 "Sora-Turbo"모델에 의존 할 것이라고 추측합니다. 또한 업계 내부자들은 ChatGpt가 아직 GPT-4O를 기반으로 멀티 모달 이미지 생성 기능을 출시하지 않았으므로 SORA 프로젝트의 출시는 주목할만한 새로운 진보가 될 것이라고 지적했습니다.
SORA의 텍스트-이미지 생성기의 코드 이름을 "파파야"라고 불리며,이 프로젝트에 대해 사람들이 호기심을 느끼고 기대합니다. Dall-E3가 출시 된 지 1 년 반 후, 차세대 모델이 가져올 혁신은 사람들이 알아 내고 싶어하는 것입니다.
요컨대, Sora의 이미지 생성 기능이 시작될 예정이며, 사용자에게보다 창의적인 가능성을 제공하며 기대할 가치가 있습니다.