Les dernières prévisions du Gartner montrent que le domaine de l’intelligence artificielle générative (GenAI) connaît des changements sans précédent. D’ici 2027, les solutions GenAI multimodales représenteront 40 % du marché, ce qui signifie que l’IA sera capable de traiter simultanément plusieurs types de données, tels que le texte, les images, l’audio et la vidéo, ce qui aura un impact profond. sur les applications d'entreprise. Cet article approfondira les prédictions de Gartner et analysera les tendances futures de développement de la GenAI multimodale, des grands modèles de langage open source (LLM) et des modèles GenAI spécifiques à un domaine, ainsi que les opportunités et les défis qu'ils apportent aux entreprises.
Lors du récent Gartner IT Symposium, les analystes ont partagé une prédiction convaincante : d'ici 2027, 40 % des solutions d'intelligence artificielle générative (GenAI) seront multimodales, capables de traiter du texte, des images, de l'audio et de la vidéo. Cette proportion a considérablement augmenté par rapport à 1 % en 2023. Ce changement aura un impact profond sur les applications d'entreprise.
Remarque sur la source de l'image : l'image est générée par l'IA et l'image est autorisée par le fournisseur de services Midjourney
Erick Brethenoux, vice-président senior de Gartner, a souligné qu'à mesure que le marché de GenAI évolue vers des modèles multimodaux, cela aidera à capturer les relations entre les différents flux de données et potentiellement à étendre les avantages de GenAI à différents types de données et d'applications. Il a souligné que la GenAI multimodale peut aider les humains à effectuer davantage de tâches dans différents environnements.
Selon le rapport Gartner Generative Artificial Intelligence Technology Boom Cycle 2024, la GenAI multimodale et les grands modèles de langage (LLM) open source sont considérés comme extrêmement influents et devraient apporter aux entreprises des avantages concurrentiels significatifs et une rapidité de réponse du marché au cours des cinq prochaines années. . Gartner a également souligné qu’au cours de la prochaine décennie, les modèles GenAI spécifiques à un domaine et les agents autonomes devraient devenir des applications grand public.
L'analyste Arun Chandrasekaran a mentionné qu'il sera difficile pour les entreprises de naviguer dans l'écosystème GenAI, car la technologie et l'environnement des fournisseurs évoluent rapidement. Bien que GenAI se trouve actuellement dans un « creux de déception », à mesure que la consolidation du secteur commence, les véritables avantages apparaîtront une fois que le battage médiatique se sera calmé, et les capacités progresseront rapidement.
La transformation de la GenAI multimodale améliorera les applications d’entreprise et introduira davantage de nouvelles fonctions. De nombreux modèles multimodaux se limitent actuellement à gérer deux ou trois modalités, mais cette diversité devrait augmenter dans les années à venir. Brethenoux a mentionné que dans la vie réelle, les gens comprennent les informations grâce à une combinaison d'audio, de vision et de ressenti, la GenAI multimodale est donc cruciale.
Concernant le modèle de grand langage open source, Chandrasekaran a souligné qu'il offre aux entreprises un potentiel d'innovation et peut réduire la dépendance à l'égard de fournisseurs spécifiques grâce à la personnalisation, aux contrôles de confidentialité et de sécurité, à la transparence du modèle, etc. En fin de compte, le LLM open source peut fournir des modèles plus petits et plus faciles à former pour aider les processus métier de base des entreprises.
Les modèles GenAI spécifiques à un domaine sont optimisés pour des secteurs ou des tâches spécifiques, améliorant ainsi l'alignement des cas d'utilisation au sein de l'entreprise et améliorant la précision et la sécurité. Chandrasekaran a en outre déclaré que ces modèles peuvent permettre une réalisation plus rapide de la valeur, de meilleures performances et une sécurité renforcée, encourageant les organisations à adopter GenAI dans un plus large éventail de cas d'utilisation.
Les systèmes d'agents autonomes peuvent atteindre leurs objectifs sans intervention humaine, en utilisant la technologie de l'IA pour identifier des modèles, prendre des décisions et générer des résultats. Brethenoux a souligné que les agents autonomes représentent une avancée majeure dans les capacités de l'IA, qui entraînera des améliorations des opérations commerciales et de l'expérience client, tout en conduisant potentiellement à un changement des modèles de travail au sein des organisations, de l'exécution à la supervision.
Souligner:
D’ici 2027, 40 % des solutions d’IA générative réaliseront une intégration multimodale, soit une augmentation significative par rapport à 2023.
La GenAI multimodale et les grands modèles de langage open source devraient apporter des avantages concurrentiels significatifs au cours des cinq prochaines années.
Les modèles GenAI spécifiques à un domaine peuvent améliorer la précision et la sécurité des applications d'entreprise et encourager une adoption plus large.
Dans l’ensemble, le développement rapide de la GenAI multimodale modifiera profondément les applications d’entreprise, et les modèles open source LLM et spécifiques à un domaine offriront également aux entreprises plus de choix et d’espace d’innovation. Même si des défis subsistent, l’avenir de GenAI est prometteur et ses avantages apparaîtront progressivement à mesure que la technologie mûrira. Les entreprises doivent s’adapter activement à cette tendance pour garder une longueur d’avance sur la concurrence à l’avenir.