Alibaba Cloud Bailian 대형 모델 서비스 플랫폼은 최근 '오디오 및 비디오 실시간 상호 작용' 기능을 출시했습니다. 이 기능은 프로그래밍 경험이 없는 사용자도 쉽게 시작할 수 있도록 다중 모드 AI 애플리케이션의 구축 프로세스를 단순화하도록 설계되었습니다. 이러한 움직임은 AI 애플리케이션 개발의 문턱을 크게 낮추어 사용자가 AI 모델을 다양한 플랫폼에 신속하게 통합하고 그 결과를 다른 사람들과 쉽게 공유할 수 있게 해줍니다. 이 플랫폼은 강력한 시각적 에이전트 기능을 갖춘 Alibaba Cloud Qwen2-VL 대형 모델을 포함하여 텍스트, 음성 및 시각적 이해와 같은 다양한 양식을 다루는 200개 이상의 대형 모델을 제공하여 사용자에게 다양한 선택권을 제공합니다.
Alibaba Cloud Bailian 대형 모델 서비스 플랫폼은 최근 '오디오 및 비디오 실시간 상호 작용' 기능을 출시했습니다. 이를 통해 사용자는 프로그래밍 지식 없이도 다중 모드 AI 애플리케이션을 쉽게 구축할 수 있습니다. 이 새로운 기능을 통해 사용자는 AI 모델을 웹, iOS 및 Android 애플리케이션에 신속하게 통합하고 다른 사람들과 공유할 수 있습니다.
사용자는 간단한 단계로 에이전트 애플리케이션을 구축할 수 있습니다. 먼저 새 에이전트 애플리케이션을 만든 다음 Alibaba Cloud Bailian 플랫폼에서 필요한 텍스트, 음성 또는 시각적 이해 대형 모델을 선택하고 구성합니다. 이 플랫폼은 강력한 시각적 에이전트 기능을 갖춘 Alibaba Cloud Qwen2-VL 대형 모델을 포함하여 200개 이상의 대형 모델을 제공합니다. 다음으로 사용자는 프롬프트 단어를 작성하고, 오디오 및 비디오 API-KEY를 설정하고, 자신만의 독점 AI 애플리케이션을 게시해야 합니다. 출시 후 사용자는 API, 웹 페이지, WeChat 애플릿, DingTalk 로봇 등을 포함한 다양한 출시 채널을 선택할 수 있습니다. 또한 오디오 및 비디오 SDK를 통해 에이전트를 웹, iOS 또는 Android 애플리케이션에 통합할 수도 있습니다.
또한 Alibaba Cloud Bailian 플랫폼은 사용자가 상호 작용 인식의 정확성을 높이기 위해 지식 기반을 구성하고 AI 답변을 보다 안정적으로 만들기 위한 워크플로를 구성하는 데 도움이 되는 추가 튜토리얼도 제공합니다. 현재 Alibaba Cloud Bailian의 Tongyi API 가격은 토큰 백만 개당 최소 0.3위안으로 떨어졌습니다. 이를 통해 사용자는 AI 비서와 같이 듣고 보고 말할 수 있는 다중 모드 지능형 에이전트를 저렴한 비용으로 구축할 수 있습니다. AI 교사, 가상 동반자 등
이 새로운 기능의 출시로 AI 애플리케이션 개발의 한계가 더욱 낮아져 개인과 기업이 다양한 비즈니스 요구 사항을 충족하는 지능형 애플리케이션을 신속하게 구축하고 배포할 수 있습니다. Alibaba Cloud Bailian 대형 모델 서비스 플랫폼의 이번 업데이트는 AI 기술의 대중화를 촉진하고 기술 적용의 어려움을 줄이는 데 있어 중요한 진전을 보여줍니다.
전체적으로 Alibaba Cloud Bailian 대형 모델 서비스 플랫폼의 '오디오 및 비디오 실시간 상호 작용' 기능은 사용자에게 편리하고 효율적인 다중 모드 AI 애플리케이션 개발 솔루션을 제공하고 AI 기술의 대중화와 적용을 촉진하는 가치가 있습니다. 앞으로 기대됩니다.