트웰브랩스는 영상을 분석하고 검색할 수 있는 인공지능을 개발 중이다.

저자：Eve Cole 업데이트 시간：2024-12-21 09:00:02

정보 폭발 시대에 비디오 콘텐츠는 기하급수적으로 증가하고 있으며 기존의 검색 및 분석 기술로는 더 이상 수요를 충족할 수 없습니다. 인공지능 기술을 활용해 영상 이해에 혁명적인 변화를 가져오는 트웰브랩스(Twelve Labs)가 탄생했습니다. 회사가 개발한 고급 모델은 영상 콘텐츠를 깊이 이해하고 단순한 키워드 인식을 넘어 행위, 사물, 소리에 대한 정밀한 분석을 가능하게 하여 사용자에게 보다 정확하고 효율적인 영상 검색 및 분석 경험을 제공합니다.

디지털 미디어의 홍수 속에서 비디오는 전례 없는 속도로 성장하고 있습니다. 그러나 기존의 검색 및 분석 방법은 항상 기술의 한계로 인해 제한을 받습니다. Twelve Labs는 인공 지능의 힘을 사용하여 비디오 콘텐츠에 대한 혁신적인 이해를 제공함으로써 이러한 상황을 혁신하고 있습니다.

기존의 동영상 검색은 제목과 태그 수준에서만 중지되며 이는 빙산의 일각만 보는 것과 같습니다. Twelve Labs의 설립자인 Jae Lee는 진정한 영상 이해에는 더 깊은 기술이 필요하다는 것을 알고 있습니다. 그들의 모델은 키워드를 인식하는 것 이상으로 비디오의 동작, 개체 및 배경 소리도 이해할 수 있습니다.

즉, 사용자는 "빨간 셔츠를 입은 남자는 언제 식당에 들어왔나요?"와 같이 매우 정확한 질문을 하고 정확한 답변을 얻을 수 있습니다. 이러한 파괴적인 기능은 Nvidia 및 Samsung과 같은 거대 기술 기업의 관심을 끌었습니다.

Google과 Microsoft의 일반적인 다중 모드 모델과 달리 Lab 12는 독특한 접근 방식을 취하고 비디오 이해에 중점을 둡니다. 이 모델을 통해 개발자는 광고 배치부터 콘텐츠 조정까지 다양한 응용 프로그램을 사용하여 자신만의 비디오 분석 도구를 맞춤 설정할 수 있습니다.

더욱 칭찬할 만한 점은 트웰브랩스가 항상 기술을 혁신하면서도 윤리적 감수성을 유지한다는 점입니다. 그들은 AI 모델의 공정성과 포괄성을 보장하기 위해 엄격한 편견 테스트 메커니즘을 개발하고 있습니다.

이 회사의 Marengo 모델은 단일 비디오 분석을 넘어 비디오, 이미지 및 오디오 전반에 걸쳐 "모든 대 모든" 검색 기능을 제공합니다. 이 다중 모드 임베딩 기술은 이상 탐지와 같은 복잡한 애플리케이션에 대한 새로운 가능성을 열어줍니다.

최근 3,000만 달러의 자금을 지원받은 트웰브랩스는 SK텔레콤, 허브스팟벤처스 등 투자자들의 지지를 받아 인공지능 발전의 선두에 서 있다. 전 Apple Siri 설계자인 Yin Jin의 합류는 회사의 세계화 전략에 새로운 추진력을 불어넣었습니다.

회사의 목표는 야심적입니다. 미래에는 자동차, 보안 등 다양한 수직 분야에 배치하고 국방 기술에도 참여할 수도 있습니다. 특히 인큐텔의 투자는 자사 기술이 국가 안보 분야에 적용될 가능성을 암시한다.

Twelve Labs는 비디오 콘텐츠를 이해하고 상호 작용하는 방식을 재정의하고 있습니다. 정보 폭발 시대에 책임감과 혁신에 중점을 둔 AI 기술은 디지털 미디어 혁명을 촉진하는 핵심 동력이 될 것입니다.

비디오가 더 이상 정적인 콘텐츠가 아니라 텍스트만큼 깊게 이해되고 상호작용될 수 있게 되면 우리는 새로운 정보화 시대를 맞이하게 될 것입니다. 그리고 이 시대의 선두에 12번 연구소가 서있습니다.

전체적으로 영상이해 분야의 기술적 혁신과 윤리성을 강조하는 랩12는 디지털 미디어 분야의 인공지능 기술 혁신을 선도하고 있어 앞으로의 발전이 기대된다.