El último pronóstico de Gartner muestra que el campo de la inteligencia artificial generativa (GenAI) está experimentando cambios sin precedentes. Para 2027, las soluciones GenAI multimodal representarán el 40% del mercado, lo que significa que la IA podrá procesar múltiples tipos de datos como texto, imágenes, audio y video al mismo tiempo, lo que tendrá un profundo impacto. en aplicaciones empresariales. Este artículo profundizará en las predicciones de Gartner y analizará las tendencias de desarrollo futuro de GenAI multimodal, modelos de lenguaje grande (LLM) de código abierto y modelos GenAI de dominio específico, así como las oportunidades y desafíos que brindan a las empresas.
En el reciente Simposio de TI de Gartner, los analistas compartieron una predicción convincente: para 2027, el 40% de las soluciones de inteligencia artificial generativa (GenAI) serán multimodales, capaces de procesar texto, imágenes, audio y vídeo. Esta proporción ha crecido drásticamente en comparación con el 1% en 2023. Este cambio tendrá un profundo impacto en las aplicaciones empresariales.
Nota sobre la fuente de la imagen: la imagen es generada por IA y la imagen está autorizada por el proveedor de servicios Midjourney
Erick Brethenoux, vicepresidente senior de Gartner, señaló que a medida que el mercado GenAI se desarrolle hacia modelos multimodales, esto ayudará a capturar las relaciones entre diferentes flujos de datos y potencialmente extender los beneficios de GenAI a varios tipos de datos y aplicaciones. Hizo hincapié en que la GenAI multimodal puede ayudar a los humanos a realizar más tareas en diferentes entornos.
Según el Informe del ciclo de auge de la tecnología de inteligencia artificial generativa de Gartner de 2024, la GenAI multimodal y los modelos de lenguaje grande (LLM) de código abierto se consideran extremadamente influyentes y se espera que aporten importantes ventajas competitivas y velocidad de respuesta del mercado a las empresas en los próximos cinco años. . Gartner también señaló que dentro de la próxima década, se espera que los modelos GenAI de dominio específico y los agentes autónomos logren una aplicación generalizada.
El analista Arun Chandrasekaran mencionó que será un desafío para las empresas navegar por el ecosistema GenAI porque la tecnología y el entorno de proveedores están cambiando rápidamente. Aunque GenAI se encuentra actualmente en un “punto de decepción”, a medida que comienza la consolidación de la industria, los beneficios reales surgirán una vez que el entusiasmo disminuya y las capacidades avanzarán rápidamente.
La transformación de GenAI multimodal mejorará las aplicaciones empresariales e introducirá más funciones nuevas. Muchos modelos multimodales se limitan actualmente a manejar dos o tres modalidades, pero se espera que esta diversidad aumente en los próximos años. Brethenoux mencionó que en la vida real, las personas entienden la información a través de una combinación de audio, visión y sentimiento, por lo que la GenAI multimodal es crucial.
Con respecto al modelo de gran lenguaje de código abierto, Chandrasekaran señaló que brinda a las empresas el potencial de innovación y puede reducir la dependencia de proveedores específicos a través de personalización, controles de privacidad y seguridad, transparencia del modelo, etc. En última instancia, el LLM de código abierto puede proporcionar modelos más pequeños y más fáciles de entrenar para ayudar a los procesos comerciales centrales de las empresas.
Los modelos GenAI de dominio específico están optimizados para industrias o tareas específicas, lo que mejora la alineación de los casos de uso dentro de la empresa y mejora la precisión y la seguridad. Chandrasekaran afirmó además que estos modelos pueden lograr una realización de valor más rápida, un mejor rendimiento y una seguridad más sólida, alentando a las organizaciones a adoptar GenAI en una gama más amplia de casos de uso.
Los sistemas de agentes autónomos pueden lograr objetivos sin intervención humana, utilizando tecnología de inteligencia artificial para identificar patrones, tomar decisiones y generar resultados. Brethenoux enfatizó que los agentes autónomos representan un gran salto en las capacidades de IA, lo que impulsará mejoras en las operaciones comerciales y la experiencia del cliente, al tiempo que potencialmente conducirá a un cambio en los modelos de trabajo dentro de las organizaciones, desde la ejecución hasta la supervisión.
Destacar:
Para 2027, el 40% de las soluciones de IA generativa lograrán una integración multimodal, un aumento significativo con respecto a 2023.
Se espera que la GenAI multimodal y los grandes modelos de lenguajes de código abierto aporten importantes ventajas competitivas en los próximos cinco años.
Los modelos GenAI de dominios específicos pueden mejorar la precisión y la seguridad de las aplicaciones empresariales y fomentar una adopción más amplia.
Con todo, el rápido desarrollo de GenAI multimodal cambiará profundamente las aplicaciones empresariales, y los LLM de código abierto y los modelos de dominios específicos también brindarán a las empresas más opciones y espacio para la innovación. Aunque persisten desafíos, el futuro de GenAI es prometedor y sus beneficios surgirán gradualmente a medida que la tecnología madure. Las empresas deben adaptarse activamente a esta tendencia para mantenerse por delante de la competencia en el futuro.