Alibaba Cloud Bailian Large Model Service Platform a récemment lancé la fonction « interaction audio et vidéo en temps réel ». Cette fonction est conçue pour simplifier le processus de construction d'applications d'IA multimodales, afin que même les utilisateurs sans expérience en programmation puissent facilement démarrer. Cette décision abaisse considérablement le seuil de développement d'applications d'IA, permettant aux utilisateurs d'intégrer rapidement des modèles d'IA dans diverses plates-formes et de partager facilement leurs résultats avec d'autres. La plateforme fournit plus de 200 grands modèles, couvrant plusieurs modalités telles que la compréhension textuelle, vocale et visuelle, y compris le grand modèle Alibaba Cloud Qwen2-VL doté de puissantes capacités d'agent visuel, offrant aux utilisateurs une multitude de choix.
Alibaba Cloud Bailian Large Model Service Platform a récemment lancé la fonction « interaction audio et vidéo en temps réel », permettant aux utilisateurs de créer facilement des applications d'IA multimodales sans connaissances en programmation. Cette nouvelle fonctionnalité permet aux utilisateurs d'intégrer rapidement des modèles d'IA dans des applications Web, iOS et Android et de les partager avec d'autres.
Les utilisateurs peuvent créer une application d'agent en quelques étapes simples : créez d'abord une nouvelle application d'agent, puis sélectionnez et configurez le grand modèle de compréhension textuelle, vocale ou visuelle requis sur la plateforme Alibaba Cloud Bailian. La plate-forme fournit plus de 200 grands modèles, dont le grand modèle Alibaba Cloud Qwen2-VL doté de puissantes capacités d'agent visuel. Ensuite, les utilisateurs doivent écrire des mots d'invite, définir la clé API audio et vidéo et publier leurs propres applications d'IA exclusives. Après la publication, les utilisateurs peuvent choisir différents canaux de publication, notamment l'API, les pages Web, les applets WeChat, les robots DingTalk, etc. Ils peuvent également intégrer l'agent dans les applications Web, iOS ou Android via le SDK audio et vidéo.
En outre, la plateforme Alibaba Cloud Bailian fournit également des didacticiels supplémentaires pour aider les utilisateurs à configurer la base de connaissances afin d'améliorer la précision de la reconnaissance des interactions et à configurer le flux de travail pour rendre les réponses de l'IA plus stables. À l'heure actuelle, le prix de l'API Tongyi sur Alibaba Cloud Bailian est tombé à un minimum de 0,3 yuan par million de jetons, permettant aux utilisateurs de créer des agents intelligents multimodaux capables d'entendre, de voir et de parler à faible coût, tels que des assistants IA, Professeurs d'IA, compagnons virtuels, etc.
Le lancement de cette nouvelle fonctionnalité abaisse encore le seuil de développement d'applications d'IA, permettant aux particuliers et aux entreprises de créer et de déployer rapidement des applications intelligentes pour répondre à divers besoins commerciaux. Cette mise à jour de la plate-forme de services à grand modèle Alibaba Cloud Bailian démontre ses progrès importants dans la promotion de la vulgarisation de la technologie de l'IA et la réduction de la difficulté de l'application de la technologie.
Dans l'ensemble, la fonction « interaction audio et vidéo en temps réel » de la plate-forme de services à grand modèle Alibaba Cloud Bailian offre aux utilisateurs des solutions de développement d'applications d'IA multimodales pratiques et efficaces, et favorise la vulgarisation et l'application de la technologie d'IA. j'attends avec impatience l'avenir.