La première tasse de café de cet automne a été commandée par l'agent intelligent.
À partir de septembre, l’application d’IA Zhi Xiaobao d’Alipay et l’AutoGLM intelligent de Zhipu peuvent aider les utilisateurs à commander un latte à la noix de coco cru avec moins de sucre et sans glace. Honor a même lancé un grand pas en avant : permettre au YOYO intelligent de commander 2 000 tasses en une seule fois.
Lorsque la multimodalité dote un agent d'"yeux" et d'"oreilles", elle commence à s'avérer prometteuse en termes de capacités opérationnelles proches de celles d'une femme de ménage humaine - cette génération d'agents commence à apprendre à aider les humains à "jouer avec les téléphones portables", grâce à leurs achats quotidiens. à des amis L'IA peut aider les utilisateurs à tout faire, de la formulation de commentaires à la planification du voyage.
Dès lors, l’Internet mobile annonce-t-il une nouvelle révolution en matière d’intelligence ?
À l’ère de l’Internet mobile, les super applications forment une boucle fermée de trafic en intégrant des services, mais l’émergence d’agents intelligents devrait redéfinir la connexion entre les personnes et les services.
Les gens commencent à se demander si ce changement va redéfinir le nouveau paysage des entreprises technologiques : avec l’arrivée des agents intelligents, les applications vont-elles mourir ?
La réponse est que les applications qui ne peuvent pas être supprimées évolueront avec l’aide d’agents intelligents.
Aujourd’hui, Super App est loin d’être un logiciel, mais une entrée dans un style de vie.
Par exemple, utiliser Alipay n'est pas seulement pour le paiement, mais aussi pour accéder à des scènes de la vie telles que la gestion financière, les voyages, les soins médicaux et le tourisme ; utiliser Meituan n'est pas seulement pour les plats à emporter, mais aussi pour la vie locale comme les restaurants ; , les supermarchés et les films ; en utilisant Douyin, ce n'est pas seulement les courtes vidéos sont un écosystème commercial transportant un contenu vidéo massif.
Dans le passé, à l'ère du paiement mobile, ces super applications finissaient par être « confuses », établissant des codes QR, créant des mini-programmes et construisant un réseau de services numériques grâce à l'ouverture. À l'ère de l'IA, ils peuvent également se connecter à des milliers de commerçants et d'institutions hors ligne et aider des dizaines de millions de commerçants et d'institutions à passer du numérique à l'intelligent.
Ce n’est que lorsque l’agent intelligent est connecté aux besoins réels des utilisateurs qu’il peut réellement se concrétiser. Celui qui peut créer le prochain écosystème d’agents intelligents qui répond pleinement aux besoins des utilisateurs peut devenir le roi de l’entrée dans l’ère de l’IA.
"Les éléments qui répondent au langage naturel et peuvent accomplir de nombreuses tâches différentes basées sur la connaissance de l'utilisateur sont appelés agents. Non seulement les agents changeront la façon dont chacun interagit avec les ordinateurs, mais ils constitueront la prochaine plate-forme."
La définition de l’intelligence donnée par Bill Gates est aussi l’avenir que nous imaginons à l’ère de l’IA.
Cependant, au cours du premier semestre, les principaux fabricants se sont réunis pour parier sur la phase 1.0 de la plate-forme d'agents intelligents, et leur investissement en argent réel n'a pas réussi à faire rapidement sensation dans le pool de trafic.
À l'étranger, le GPT Store d'Open AI a été lancé dès janvier de cette année, et Ultraman avait espéré qu'il deviendrait le prochain « App Store » au niveau national, de grands fabricants tels que Byte, Baidu et Alibaba ont également lancé successivement des plates-formes intelligentes, épinglant ; leurs espoirs sur Créer une "Super intelligence" (super intelligence).
Cependant, à l’ère 1.0, limité par le développement des capacités multimodales, l’agent de l’époque ressemblait davantage à un robot de dialogue IA éloquent. Même s’il pouvait fournir des connaissances aux utilisateurs, il ne pouvait s’arrêter qu’à obtenir des suggestions.
Par conséquent, en termes de fidélité des utilisateurs, la plupart des gens conservent une attitude de « première adoption » à l'égard des agents intelligents. Même avec le trafic écrasant des grands fabricants, la croissance des agents intelligents a été faible en termes de performances ultérieures. Sur la plateforme, aucun agent super intelligent n'est né jusqu'à présent.
En dernière analyse, il s’agit d’un grand nombre de fausses demandes créées par les capacités de l’IA qui ne répondent pas aux véritables problèmes des utilisateurs.
Par rapport à l'étape 1.0, l'Agent 2.0 se concentre sur des scénarios spécifiques et tente de répondre aux « besoins réels » des utilisateurs.
Auparavant, les applications côté B des agents d'IA étaient principalement axées sur l'écriture de code et la création auxiliaire, tandis que du côté C, des agents intelligents tels que l'accompagnement orienté utilisateur et le conseil psychologique étaient dérivés. Depuis juillet de cette année, selon les statistiques de QuestMobile, la rédaction, le travail sur le lieu de travail et la camaraderie émotionnelle sont devenus des orientations courantes pour la mise en œuvre d'agents intelligents dans les produits AIGC grand public.
Selon les statistiques de la liste des produits IA, cette année seulement, le nombre d'agents intelligents a augmenté de 179 000, soit 1,5 fois plus rapide que le taux de croissance des applications de l'App Store.
Source : QuêteMobile
Au cours du second semestre de cette année, les agents ont montré de nombreux changements dans la collaboration multitâche.
"L'intelligence des grands modèles d'aujourd'hui évolue constamment d'applications simples à des applications complexes, en particulier dans l'expansion des agents vers des modèles de raisonnement o1, de sorte que le système évolue progressivement pour pouvoir interagir en permanence avec l'extérieur", a déclaré Zhang Fan, COO de Zhipu.
Commander des plats à emporter et réserver des billets d’avion en une seule phrase est devenu une réalité :
En septembre, Alipay a lancé sa première application native orientée services, Zhi Xiaobao, en tant que gestionnaire de la vie de l'IA, qui peut aider les utilisateurs à accomplir « la nourriture, les vêtements, le logement et le transport ». Ils peuvent accomplir des tâches quotidiennes telles que commander de la nourriture, glisser des codes de métro. , et héler un taxi avec juste des instructions. Il peut également être détecté intelligemment en fonction du temps et de l'espace utilisés par les utilisateurs, il recommande intelligemment des services tels que des podcasts d'actualités, des demandes de livraison express et des stratégies de voyage.
En octobre, Zhipu a lancé l'AutoGLM intelligent, qui peut sélectionner indépendamment plusieurs applications à utiliser et aider les utilisateurs à effectuer des interactions avec leur téléphone mobile.
Par la suite, les fabricants de téléphones mobiles ont également emboîté le pas. L'assistant intelligent YOYO de Honor et Phone Use de Vivo peuvent aider les utilisateurs à effectuer des opérations inter-applications grâce à des instructions en une seule phrase.
Dans le passé, les utilisateurs avaient besoin de trouver des fonctions massives dans des interfaces complexes, ce qui équivalait à augmenter le coût d'utilisation pour l'utilisateur. Désormais, simplement en exprimant ses besoins par la voix ou par texte, l'agent peut accéder directement au service et proposer le service souhaité directement à l'utilisateur.
À ce stade, en s'attaquant aux besoins urgents de la vie quotidienne, l'agent intelligent 2.0 a trouvé une direction révolutionnaire : l'agent intelligent « gouvernante ».
Qu'il s'agisse de commander des plats à emporter, de les ajouter aux paniers ou d'annuler le renouvellement automatique d'applications, les fabricants tentent d'intégrer les appareils intelligents dans nos nécessités quotidiennes, simplifiant davantage l'interaction entre les personnes et les services et libérant les utilisateurs des interactions quotidiennes avec les machines. Par exemple, "Zhi Xiaobao" a toujours souligné que "les choses peuvent être faites avec juste un mot".
Bien que de nombreux « produits de majordome IA » actuellement sur le marché puissent fournir un nombre relativement limité de services d'IA et ne puissent pas effectuer des tâches plus complexes et personnalisées, cette direction évolutive de l'interaction homme-machine nous permet au moins de voir que la technologie Nous évoluons dans un nouvelle direction - en plus du dialogue, nous pouvons également laisser l'IA « regarder mes yeux et agir » pour rendre la vie plus simple.
À l’ère de l’Internet mobile, le trafic, c’est la vie. L’émergence d’agents intelligents va également remodeler les règles de répartition du trafic.
À l'ère 1.0, les entreprises technologiques de l'étranger et du pays tentent de créer des plates-formes d'agents super intelligentes pour regrouper le trafic via des agents intelligents.
Mais la façon de penser de l’ère 2.0 a changé. Aujourd'hui, tout le monde essaie de transformer le corps intelligent en une « femme de ménage intelligente » sur le téléphone mobile et en une nouvelle porte d'entrée pour connecter les utilisateurs et les services.
La manifestation la plus évidente de ce changement est la configuration des fabricants de téléphones mobiles. Lors du Consumer Electronics Show 2024 à Berlin, en Allemagne, Fang Fei, président de Honor Product Line, a déclaré : « Si l'assistant intelligent actuel permet une conduite manuelle sur les téléphones mobiles, alors l'agent intelligent IA conduira automatiquement sur les téléphones mobiles. l'avenir."
Il peut y avoir des prédictions comme celle-ci : lorsque l'agent intelligent sur le téléphone mobile commencera à apprendre à appeler les fonctions requises dans toutes les applications, comme utiliser Meituan pour commander des plats à emporter, ouvrir Taobao pour acheter des produits de première nécessité et, en démontant des scénarios de tâches, sélectionner différentes opérations d'application. pour terminer la tâche. En conséquence, la super application n'a besoin que de fournir quelques interfaces que l'agent intelligent peut appeler. À long terme, l'application deviendra une partie des capacités de l'agent intelligent, et le trafic qui aurait dû circuler vers la super application en fera également partie. l'agent intelligent.
Mais à l’ère de la diversification des affaires, les relations de compétition et de coopération sont la norme. D'une part, les téléphones mobiles et les super applications doivent peaufiner leurs produits d'IA, utiliser la compétitivité des produits pour gagner des utilisateurs et rivaliser pour l'initiative sur de nouveaux marchés, d'autre part, tout comme la prospérité de l'Internet mobile est le résultat de ; tout le monde ajoute du bois de chauffage et un jour réussit, l'ère de l'IA Le réseau de services n'est en aucun cas monopolisé par un seul géant de la technologie. L'ouverture et la coopération sont toujours l'avenir de l'IA.
Comme l'a dit le PDG de Honor, Zhao Ming, il existe une relation de collaboration entre les deux. Après avoir trouvé le point limite, chacun accomplit les tâches qui lui sont assignées grâce à sa propre collaboration.
Pour les téléphones mobiles, si un agent intelligent souhaite ouvrir un écosystème de services complet, il nécessite la fourniture intégrée d'un grand nombre de ressources de services.
Quant aux applications, elles peuvent approfondir des scénarios verticaux, compléter l'évolution avec l'aide d'agents intelligents et renouveler de nombreux services à l'ère de l'IA en même temps, elles peuvent explorer davantage de façons de jouer avec la liaison logicielle et matérielle ; coopérer avec les fabricants de téléphones mobiles.
Par exemple, alors que les fabricants se précipitent pour développer des produits de recherche IA, des applications communautaires, notamment Xiaohongshu et Zhihu, tentent de créer des services de recherche verticaux grâce à leurs avantages de contenu à long terme. Prenons l'exemple de Zhihu. Il a ciblé le secteur de la recherche universitaire et a lancé une fonction de recherche professionnelle dans Zhihu Direct Answer, devenant ainsi le premier fabricant à fournir une solution unique pour la recherche par l'IA et une véritable bibliothèque papier.
Dans l’engouement actuel pour les agents intelligents, les capacités écologiques deviendront également l’atout et le fossé des applications.
Avec 4 millions de mini-programmes marchands et plus de 8 000 capacités de service de vie, le gestionnaire de vie IA d'Alipay « Zhi Xiaobao » peut prendre en charge les appels de taxis, la commande de nourriture, la réservation de billets, les codes de métro, la vérification des livraisons express, le paiement des factures de téléphone et la vérification des factures. divers services de vie - ce type de capacité d'intégration écologique est difficile à rattraper avec une plate-forme purement intelligente.
Dans le même temps, les opérations actuelles de l'IA telles que la commande de café démontrées par les fabricants de téléphones portables utilisent encore des solutions techniques basées sur des opérations de reconnaissance d'écran et de simulation (vous verrez l'IA vous aider à visualiser l'écran et à cliquer sur les boutons), ce qui nécessite des performances élevées de l'IA. téléphone mobile. , il y a encore des problèmes tels que la vitesse lente et le service unique.
Si vous voulez que l'IA fonctionne mieux, vous avez besoin de changements dans l'offre de services - un grand nombre d'organisations commerciales peuvent également « IA », construire leur propre intelligence, puis promouvoir l'innovation dans les services de vie via des interfaces ouvertes. Ce n'est que lorsque davantage de commerçants et d'institutions disposeront d'agents intelligents que l'IA ne pourra pas s'arrêter à des opérations simples comme commander du café, mais pourra vous aider à commander plus, à commander plus rapidement, à commander avec plus de précision et même à trouver le coupon le plus approprié.
Sans aucun doute, tout comme des millions de petits programmes ont été créés à l'ère de l'Internet mobile, la création d'un écosystème d'agents intelligents à l'ère de l'IA est ce pour quoi WeChat, Alipay et d'autres applications nationales sont efficaces. Combinée à l'écosystème de plate-forme unique, App peut également devenir une nouvelle plate-forme d'agents intelligents et sortir de la mêlée de l'IA à l'aide de services différenciés.
Par exemple, après que Tencent a lancé l'application d'assistant intelligent « Yuanbao », elle a créé la plate-forme intelligente « Yuanqi » ; Alipay a également lancé la plate-forme de développement intelligente « Treasure Box », permettant aux commerçants d'utiliser les téléphones intelligents pour fournir aux utilisateurs des services plus mis à jour.
Prenons l'exemple de « Huang Xiaosong ». Il s'agit d'un agent intelligent établi par la zone panoramique de Huangshan sur la plate-forme Zhixiaobao. Il peut fournir aux touristes visitant Huangshan des guides d'attractions touristiques en temps réel, des recommandations d'hôtels pittoresques, des demandes de renseignements sur les banques d'alimentation et d'autres services.
En outre, les fabricants d'applications peuvent également sortir des téléphones mobiles et s'interconnecter avec du matériel plus intelligent , tel que des lunettes AR, des haut-parleurs intelligents, des voitures intelligentes, etc. À l’avenir, l’IA sera partout, les services seront disponibles sur demande et les méthodes d’interaction homme-machine seront plus diversifiées et innovantes.
Auparavant, Doubao, une filiale de ByteDance, avait lancé Olla Friend, un casque intelligent IA, qui offre aux utilisateurs un « ami IA » combinant des fonctions telles qu'un savoir-tout portable, une formation en anglais, un guide de voyage et une station de ravitaillement émotionnel ; elles seront lancées la semaine prochaine. Les nouvelles lunettes Rokid AR lancées fonctionneront également avec Zhi Xiaobao pour lancer des fonctions telles que l'appel de taxi AI, la commande de nourriture AI et le paiement rapide par empreinte vocale, couvrant davantage de scènes de vie.
À l’ère de l’IA, le cycle de remaniement sera encore raccourci. Zhu Xiaohu a dit un jour sans ambages : « Quand tout le monde se précipite dans le point chaud, après 6 mois, si vous n'êtes pas au sommet, le point chaud n'a fondamentalement rien à voir avec vous. Quand le point chaud à court terme arrive, personne. veut quitter la table de poker en premier, l'IA La prochaine génération de nouveaux téléphones mobiles va naître, et les applications espèrent également utiliser l'IA pour évoluer à nouveau. Les pionniers qui seront les premiers à déployer gagneront sans aucun doute la prochaine ère.
Mais plus important encore : ceux qui voyagent seuls sont rapides, et ceux qui voyagent ensemble sont loin. À l'ère de l'IA, aucune entreprise n'est dominante. Il y a de la concurrence, mais il y a encore plus de coopération. L'ouverture et la connexion sont à l'origine le sens originel d'Internet. À l'ère de l'IA, ce n'est que lorsque les logiciels et le matériel sont ouverts les uns aux autres et que d'innombrables agents intelligents sont connectés les uns aux autres que de véritables changements peuvent être apportés.