Quelle est la solution au casse-tête de l’IA à 600 milliards de dollars ? Les dirigeants de startups discutent des coûts importants des modèles et de la commercialisation

Auteur：Eve Cole Date de mise à jour：2024-11-16 11:42:01

Beijing News Shell Finance News (Reporter Bai Jinlei et Chen Weicheng) Du 25 au 26 octobre, la 10e conférence Internet en temps réel RTE2024, co-parrainée par la communauté des développeurs RTE et Shengwang, s'est tenue à Pékin. Lors de la réunion, Jia Yangqing, fondateur et PDG de Lepton AI, Wei Wei, partenaire de MiniMax, Guoyang Zeng, co-fondateur et directeur de la technologie de Wall-Facing Intelligence, et Wang Tiezhen, ingénieur de Hugging Face, ont discuté des "600 $ d'IA". problème d'un milliard : partir de l'essentiel" La table ronde "Des installations à la commercialisation" a attiré l'attention de l'industrie. "Le problème de 600 milliards de dollars de l'IA" est tiré d'un article de David Cahn, associé chez Sequoia Capital, qui estime que l'écart entre les énormes investissements dans les infrastructures d'IA (intelligence artificielle) et les revenus réels est sur le point d'atteindre son point culminant. le point de bulle ; l’IA pourrait être la prochaine vague technologique de transformation, et la baisse des prix des ordinateurs GPU (unités de traitement graphique) sera en fait bénéfique pour l’innovation et les startups à long terme, tandis que les investisseurs en souffriront.

RTE2024 La 10ème conférence Internet en temps réel. Photo | Photo fournie par la personne interrogée Concernant la construction de l'infrastructure d'IA, Jia Yangqing a partagé deux points de vue principaux : Les modèles de même taille deviendront de plus en plus performants, notamment grâce à des technologies telles que la distillation et la compression. Le modèle actuel LLama 3.2 3B le peut même. ont des capacités similaires au modèle précédent LLama 70B ; à l'exception de quelques entreprises leaders, de plus en plus d'entreprises adopteront « open source + réglage fin » pour créer des modèles de nouvelle génération, de sorte que l'application de l'architecture open source deviendra de plus en plus courante. . « L'avantage du modèle open source réside dans l'écologie et la communauté. Du point de vue de l'application pratique, de nombreuses personnes peuvent trouver un modèle open source et le peaufiner, mais cela ne suffit pas à résoudre tous les problèmes liés au modèle open source. " Wang Tiezhen a déclaré : " Nous verrons à l'avenir Avec de plus en plus de travaux Infra (infrastructure) et Realtime (traitement en temps réel), tout le monde doit non seulement prêter attention au modèle open source lui-même, mais aussi prêter attention au infrastructure et données en boucle fermée du modèle open source, afin que le modèle open source puisse fonctionner mieux et plus rapidement en temps réel. Nous avons besoin de TTS (Text to Speech), et nous avons également besoin de grands modèles. Si nous pouvons les assembler d'une manière ou d'une autre et les placer plus près de l'utilisateur, nous pouvons produire de très bons résultats. " Comment devrions-nous voir la formation. et développement de grands modèles. Coût du raisonnement ? Zeng Guoyang a déclaré : « Avec les progrès de la technologie, la puissance de calcul deviendra certainement de moins en moins chère, et l'échelle des modèles dotés des mêmes capacités deviendra de plus en plus petite, mais l'optimisation du coût de la puissance de calcul se traduira finalement par la formation de modèles plus puissants. .Pour vraiment atteindre l’AGI Au niveau de l’intelligence artificielle générale, on ne peut que sentir que le modèle devient de plus en plus puissant, et il est difficile de ressentir l’évolution des coûts. » Il a également mentionné cela puisque l’intelligence murale est un modèle de bout en bout. , il est très préoccupé par la façon de procéder.Pour que le modèle s'exécute plus rapidement à la fin, pendant le processus de déploiement réel, ils utiliseront diverses méthodes de compression de quantification et même de sparsification pour optimiser la surcharge de déploiement réelle. Jia Yangqing a également souligné que le coût n'est pas un facteur à prendre en compte. Il a estimé que le coût du raisonnement tomberait à un dixième du coût actuel d'ici un an. Lors de la création d'une candidature, les entrepreneurs peuvent effectuer une comptabilité analytique basée sur le coût actuel de présentation d'une candidature, qui représente un dixième du coût actuel. pour voir si cela peut être fait, y compris les modèles, le matériel et après avoir été appliqué en grande quantité, le coût peut également être réduit. Des rapports récents indiquent qu'OpenAI est en train de dissoudre son équipe « AGI Readiness » qui se concentrait sur la recherche sur la sécurité de l'IA. Comment les fondateurs des entreprises d’IA présents voient-ils la sécurité et les questions éthiques de l’IA ? Par exemple, Jia Yangqing a déclaré que les avions actuels ont de nombreuses exigences en matière de sécurité, mais que la fabrication de fusées bénéficie de plus de flexibilité. Par conséquent, il a émis l'hypothèse qu'OpenAI pourrait être un meilleur développement précoce, ou que la sécurité de l'IA ne sortirait pas de la catégorie de sécurité traditionnelle. La sécurité traditionnelle des données et la sécurité du cloud sont des garanties suffisantes. Wang Tiezhen a déclaré qu'il est relativement tôt pour s'inquiéter du remplacement des humains par l'IA, mais que l'IA a déjà eu un impact négatif sur certaines industries, comme l'impact des vidéos fausses et réelles, y compris l'impact sur la psychologie des adolescents, et là Il existe ici de nombreuses opportunités pour l'entrepreneuriat. Lors de l'événement, Shengwang a annoncé qu'elle et MiniMax peaufinaient la première API en temps réel (interface de programmation d'applications de traitement en temps réel) de Chine. Alors, comment devrions-nous considérer le potentiel d’application pratique des modèles multimodaux audio et vidéo ? Wei Wei a déclaré qu'avec l'émergence de la multimodalité, les frontières de l'intelligence artificielle générative continueront de s'étendre et d'accélérer la transformation de cette industrie. À partir du processus de produit et de service utilisateur, Wei Wei a découvert que des modèles tels que le texte, la voix, la musique et la vidéo peuvent aider les créateurs d'art, de cinéma, de télévision, de musique et d'autres domaines à améliorer considérablement leur efficacité et à leur fournir de nouvelles idées et méthodes. . Wang Tiezhen estime également que si les effets de la génération vidéo peuvent dépasser les effets du film et n'ont pas besoin d'être générés plusieurs fois, même si le prix est élevé, certaines personnes seront prêtes à l'essayer.