Le 5 septembre, Shun Xiangyang, président du conseil d'administration de l'Université des sciences et technologies de Hong Kong et académicien étranger de l'Académie nationale d'ingénierie, a partagé ses huit réflexions sur la mise en œuvre de l'industrie du modélisme à grande échelle lors de l'Inclusion 2024. ·Conférence du Bund. Il estime que l'arrivée de l'ère des agents IA ne sera pas un modèle magique et puissant qui remplacera soudainement tous les flux de travail. Elle implique l'intégration continue de la technologie, de l'ingénierie et du marché, et présente enfin des services aux humains qui dépassent les attentes.
Pensée 1 : la puissance de calcul est le seuil "Aujourd'hui, lorsqu'on réalise de grands modèles et un apprentissage profond, la première et la plus importante chose est d'avoir une puissance de calcul", a déclaré Shen Xiangyang. Il a souligné que depuis 2010, la puissance de calcul requise pour les grands modèles a été multipliée par 6 ou 7. Il s'est stabilisé ces dernières années et a augmenté environ 4 fois par an. Le modèle devient de plus en plus grand, le nombre de paramètres devient de plus en plus grand et la demande de puissance de calcul augmente également dans une direction plate à mesure que les paramètres augmentent. Selon lui, le développement de l'ensemble de l'industrie des puces informatiques est passé de la « loi de Moore » originale à la « loi de Huang ». La loi de Moore stipulait que la puissance de calcul doublait tous les 18 mois. On prévoit désormais que le GPU permettra de doubler la puissance de calcul de l’IA d’année en année. "Cela fait mal de parler de cartes, mais il n'y a pas d'émotion si vous n'avez pas de cartes. On disait autrefois que la pauvreté limite l'imagination, mais aujourd'hui, la pauvreté peut déformer l'imagination, car s'il n'y a pas de cartes, les projets qui On peut imaginer que cela puisse être différent. » Shen Xiangyang soupira d'émotion. Pensée 2 : Des données sur des données Les informations publiques montrent que les données d'entraînement de GPT3 ont atteint un jeton (débit) de 2 T et que celles de GPT4 ont atteint environ 12 T. Selon la prédiction de Shun Xiangyang, les données d'entraînement de GPT5 pourraient atteindre 200 T. Les données actuelles sur Internet sont loin de répondre aux besoins de la future formation des modèles, et nous devons réfléchir aux moyens d'exploiter davantage de données. Dans le domaine de l'intelligence artificielle, les données sont considérées comme le « carburant » du modèle, et le modèle doit apprendre et extraire des informations utiles à partir de ces données. Par conséquent, la quantité, la qualité et la diversité des données affecteront directement la précision et les performances du modèle. Shen Xiangyang a déclaré que dans le passé, en tant qu'accumulation de base d'Internet, la plupart des données étaient utilisées par Google pour créer des moteurs de recherche. À l'avenir, ces données seront utilisées pour former de grands modèles. "Les données accumulées par Internet au cours des 40 dernières années semblent être réservées à un tel moment d'IA." Pensée 3 : Le prochain chapitre du grand modèle Quelle est la prochaine étape ? Shen Xiangyang estime que la voie de développement future de la grande industrie du modèle est très claire et qu'elle passera du modèle linguistique précédent au modèle multimodal et au modèle mondial à l'avenir. Techniquement parlant, nous devons emprunter la voie de l’unification de la compréhension et de la génération. "L'avenir s'orientera certainement vers l'intelligence incarnée et les robots. L'une des formes spéciales est la conduite autonome", a déclaré Shen Xiangyang. En fait, il n’existe pas de définition standard du modèle mondial dans l’industrie. Le modèle Sora lancé par OpenAI a déclenché des discussions sur le « modèle mondial » dans l'industrie. OpenAI le considère comme la base de modèles capables de comprendre et de simuler le monde réel, et estime que ses capacités constituent une étape importante dans la réalisation de l'AGI (intelligence générale artificielle). Cependant, Shun Xiangyang estime que "Bien que le modèle Sora soit très bon, il n'est pas si puissant. Ses propriétés physiques ne peuvent pas être garanties et il ne peut pas s'agir d'un modèle mondial". Pensée 4 : Les grands modèles balayent des milliers d’industries Les grands modèles peuvent être divisés en grands modèles généraux, grands modèles industriels, grands modèles d'entreprise et grands modèles personnels. Shen Xiangyang a souligné que les grands modèles à usage général sont la base de l'IA et que la formation d'un grand modèle à usage général nécessite au moins 10 000 calories ; la redécouverte de la valeur des données d'entreprise nécessite des centaines de calories de formation. Ces grands modèles ont des exigences extrêmement élevées en matière de puissance de calcul. "La chose la plus excitante est le modèle personnel à grande échelle. Par exemple, Lenovo et Microsoft font la promotion de l'AIPC et Apple Intelligence se développe tous dans le sens de l'intelligence personnelle", a déclaré Shen Xiangyang. À la fin du mois de juillet de cette année, la Chine avait enregistré 197 grands modèles, dont 30 % sont des grands modèles généraux et 70 % sont des grands modèles industriels. "On peut voir que les grands modèles de l'industrie représentent la grande majorité, et il y en aura certainement de plus en plus à l'avenir", a déclaré Shen Xiangyang. Pensée 5 : agent IA – de la vision à la mise en œuvre En mai 2024, le fondateur de Microsoft, Bill Gates, a déclaré publiquement qu'AI Agent changerait non seulement la façon dont chacun interagit avec les ordinateurs, mais bouleverserait également l'industrie du logiciel et provoquerait la plus grande révolution informatique depuis la saisie de commandes jusqu'au clic sur des icônes. Shun Xiangyang était d'accord avec ce point de vue. Il pense qu’à l’ère de l’intelligence artificielle, la super application vraiment étonnante est AI Agent. Dans le processus d'AI Agent, de la vision à la mise en œuvre, il est nécessaire de toujours se concentrer sur les besoins, de comprendre en profondeur les capacités du modèle et de créer un flux de travail avec une participation profonde de l'IA. " Si vous travaillez aujourd'hui dans une entreprise, l'ensemble du workflow est très complexe. Bien que ChatGPT soit très puissant, il est loin d'atteindre le niveau d'Agent. Il ne réalise qu'une seule avancée. Pour vraiment avancer, il doit être intégré dans le tout le flux de travail. ", a-t-il déclaré. Pensée 6 : Faites attention à la gouvernance de l'IA La gouvernance de l’IA est très importante. Le thème de la Conférence mondiale sur l'intelligence artificielle (WAIC) de cette année concerne la gouvernance de l'IA. Différents pays ont des points de vue très différents sur cette question. Le développement de l’IA a eu un fort impact sur les personnes, les entreprises, la supervision gouvernementale, le développement social et d’autres aspects, et a suscité des inquiétudes dans le public quant à sa gouvernance en matière de sécurité. "Je pense que le prochain point important dans le développement de l'intelligence artificielle. Du point de vue de divers pays du monde, il est nécessaire de construire une intelligence artificielle souveraine, et derrière l'intelligence artificielle souveraine, il doit y avoir un nuage souverain pour soutenir le développement de l'intelligence artificielle souveraine. intelligence artificielle", a exprimé Shen Xiangyang. Pensée 7 : Repenser la relation homme-machine « Dans quelle mesure l'impact apporté par le GPT est-il dû au choc de l'interaction homme-machine, et dans quelle mesure est le développement de l'intelligence artificielle ? » Shen Xiangyang estime que la relation entre les humains et les machines devrait être repensée. Il a souligné que l'IA offre aux humains un nouveau contexte de symbiose avec la technologie, et que le nouveau mode d'interaction homme-machine indique l'intégration et le progrès de « l'IA et de l'IA ». L’IA (Intelligent Augmentation) représente une voie de développement de l’IA centrée sur l’humain. Il se concentre sur l’utilisation de la technologie pour améliorer les capacités humaines plutôt que pour remplacer les humains, en mettant l’accent sur la relation de collaboration entre les humains et l’IA. "Le chroniqueur du New York Times, John Markoff, a mentionné que dans le développement des ordinateurs au cours des dernières décennies, le véritable gagnant a été l'interaction homme-machine. Quelle que soit la technologie, l'objectif ultime devrait être d'aider les humains à mieux utiliser les machines. " Shen Xiang Yang a déclaré : " À l'ère de l'IA, l'aspect le plus essentiel de l'interaction homme-machine est le dialogue, tout comme ChatGPT et Microsoft deviendront-ils la plus grande entreprise de l'ère de l'IA, je pense que seul le temps le fera ? dire." Pensée 8 : La nature de l’intelligence Aujourd'hui, le développement du GPT bat son plein, mais en réalité, la compréhension du renseignement par les gens est encore très limitée. Contrairement à la physique, tout, depuis le vaste ciel étoilé jusqu'aux minuscules quanta, peut être expliqué par une théorie unifiée ; de nombreux éléments de l'apprentissage profond d'aujourd'hui sont inexplicables et n'ont aucune robustesse. " L'essence de l'intelligence est la bataille centenaire entre les réseaux neuronaux et les systèmes de symboles. " Shen Xiangyang a déclaré : " Aujourd'hui, bien que le développement de l'intelligence artificielle en soit encore à un stade relativement précoce, il existe déjà de nombreuses applications dans l'industrie, qui en sont dignes, je suis déterminé à le faire et j’ai confiance en l’avenir »