오디오 및 비디오 산업이 AI와 '손을 잡으면' 어떤 '화학 반응'이 일어날까요?
저자:Eve Cole
업데이트 시간:2024-11-16 18:00:02
원탁대화. Red Net Moment News, 10월 24일 (왕 주안 기자, 우 리 특파원) 오디오 및 비디오 산업은 창사의 우세 산업 중 하나이며 혁신 과정에서 기술이 결정적인 역할을 합니다. 오디오와 비디오가 "손에 손을 잡고" AI를 사용하면 어떤 "화학 반응"이 발생합니까? 10월 24일, 창사 산업과 베이징 빅 모델 생태학 간의 비공개 CXO 회의가 창사에서 열렸습니다. 참여하는 기술 "유명 기업"은 흥분하여 각자의 답변을 내놓았습니다. Tuowei Information 부사장 Bai Bingjun, Zhipu 부사장 Wu Weijie 및 Mango Sunac Technology Co., Ltd.(5G 연구소)가 주최한 원탁 대화 "음성과 영상이 AI를 만나면 어떤 화학 반응이 일어날 것인가"라는 주제로 진행되었습니다. 국가 라디오, 영화 및 텔레비전 국장) Wu Hong, 제품 기술 센터 총책임자, Li Shaojun, Malanshan 오디오 및 비디오 연구소 제품 혁신 센터 소장, Lu Shaohe, Changsha Malanshan 투자 개발 및 건설 기술 이사 Co., Ltd.와 China Telecom Hunan AI Center 수석 이사 Zhu Fei는 오디오 및 비디오 산업 AI 애플리케이션 통신에 대해 논의했습니다. Wu Weijie는 비디오 생성, 비디오 이해 및 실시간 통화 기능에서 AI의 탐색 및 적용을 공유하면서 AI와 오디오 및 비디오의 조합이 공장 관리, 소매점 상품 배치, 관광, 의료 분야에서 널리 사용되었음을 지적했습니다. , 교통 등 분야. Wu Hong은 추천 시스템, 콘텐츠 리뷰 등 오디오 및 비디오 산업에서 AI의 초기 적용을 강조했으며, 오디오 및 비디오 관련 세대에서는 AIGC 세대가 아직 초기 단계에 있으며 여전히 많은 여지가 있다고 믿었습니다. 앞으로의 발전을 위해. 또한 데이터화가 지능의 기초라고 믿으며 AI와 오디오, 비디오를 결합한 정보화의 중요성을 강조했습니다. Li Shaojun은 생방송의 수동 개입 감소, 생방송 경험 개선, AI를 통한 매개변수 동적으로 조정 등 AI와 생방송 기술의 통합에 대한 Malanshan 오디오 및 비디오 연구소의 연구 결과를 공유했습니다. 그는 오디오 및 비디오 산업에 AI를 적용하려면 컴퓨팅 성능 및 대역폭과 같은 제한 요소를 고려해야 한다고 믿으며 특정 시나리오에서 AI 적용 문제를 해결하기 위해 에지에 소형 모델을 배포할 것을 제안합니다. 산업적 관점에서 Lu Shaohe는 오디오 및 비디오 산업에 힘을 실어주는 AI가 높은 콘텐츠 제작 비용, 어려운 디지털 자산 관리, 제한된 콘텐츠 출력 용량, 콘텐츠 수익 창출 부족 등의 문제를 해결하여 오디오 및 비디오 산업에 더 많은 이점을 가져올 수 있다고 제안했습니다. . 새로운 가능성이 너무 많습니다. 오디오 및 비디오 산업이 모이는 장소인 Malanshan은 테스트 및 애플리케이션 구현을 위해 대규모 모델 회사를 공원에 초대하고 모든 당사자와 협력하여 Malanshan의 데이터와 자산을 활성화하기를 희망합니다. Zhu Fei는 음성 인식, 다중 모드 이해 작업 등 비즈니스 관점에서 오디오 및 비디오 분야의 AI 적용을 소개했으며, 차이나 텔레콤이 AI 기술을 오디오 및 비디오 산업에 더 잘 적용할 수 있는 방법을 적극적으로 모색하고 있다고 말했습니다. 이번 대화는 AI와 오디오 및 비디오 산업의 통합 발전을 위한 귀중한 아이디어와 방향을 제공했을 뿐만 아니라 전체 오디오 및 비디오 산업 체인의 발전을 촉진하는 데 새로운 활력과 동기를 부여했습니다.