A última previsão da Gartner mostra que o campo da inteligência artificial generativa (GenAI) está a passar por mudanças sem precedentes. Até 2027, as soluções multimodais GenAI representarão 40% do mercado, o que significa que a IA será capaz de processar vários tipos de dados, como texto, imagens, áudio e vídeo ao mesmo tempo, o que terá um impacto profundo em aplicativos corporativos. Este artigo se aprofundará nas previsões do Gartner e analisará as tendências futuras de desenvolvimento de GenAI multimodal, grandes modelos de linguagem de código aberto (LLM) e modelos GenAI de domínio específico, bem como as oportunidades e desafios que eles trazem para as empresas.
No recente Simpósio de TI da Gartner, os analistas compartilharam uma previsão convincente: até 2027, 40% das soluções de inteligência artificial generativa (GenAI) serão multimodais, capazes de processar texto, imagens, áudio e vídeo. Esta proporção cresceu dramaticamente em comparação com 1% em 2023. Esta mudança terá um impacto profundo nas aplicações empresariais.
Nota sobre a fonte da imagem: A imagem é gerada por IA e é autorizada pelo provedor de serviços Midjourney
Erick Brethenoux, vice-presidente sênior do Gartner, destacou que à medida que o mercado GenAI se desenvolve em direção a modelos multimodais, isso ajudará a capturar as relações entre diferentes fluxos de dados e potencialmente estender os benefícios do GenAI a vários tipos de dados e aplicações. Ele enfatizou que o GenAI multimodal pode ajudar os humanos a realizar mais tarefas em diferentes ambientes.
De acordo com o Relatório do Ciclo de Boom da Tecnologia de Inteligência Artificial Generativa de 2024 do Gartner, GenAI multimodal e modelos de linguagem grande (LLM) de código aberto são considerados extremamente influentes e deverão trazer vantagens competitivas significativas e velocidade de resposta do mercado para as empresas nos próximos cinco anos. . O Gartner também destacou que, na próxima década, espera-se que modelos GenAI específicos de domínio e agentes autônomos alcancem aplicação convencional.
O analista Arun Chandrasekaran mencionou que será um desafio para as empresas navegar no ecossistema GenAI porque a tecnologia e o ambiente dos fornecedores estão mudando rapidamente. Embora a GenAI esteja atualmente num “vale de desilusão”, à medida que a consolidação da indústria começa, os benefícios reais surgirão depois de o hype diminuir e as capacidades avançarão rapidamente.
A transformação da GenAI multimodal irá aprimorar as aplicações empresariais e introduzir mais novas funções. Muitos modelos multimodais estão atualmente limitados a lidar com duas ou três modalidades, mas espera-se que esta diversidade aumente nos próximos anos. Brethenoux mencionou que na vida real, as pessoas entendem as informações através de uma combinação de áudio, visão e sentimento, portanto a GenAI multimodal é crucial.
Em relação ao modelo de grande linguagem de código aberto, Chandrasekaran destacou que ele fornece às empresas o potencial de inovação e pode reduzir a dependência de fornecedores específicos através de personalização, controles de privacidade e segurança, transparência de modelo, etc. Em última análise, o LLM de código aberto pode fornecer modelos menores e mais fáceis de treinar para ajudar os principais processos de negócios das empresas.
Os modelos GenAI específicos de domínio são otimizados para setores ou tarefas específicas, melhorando o alinhamento de casos de uso dentro da empresa e melhorando a precisão e a segurança. Chandrasekaran afirmou ainda que estes modelos podem alcançar uma realização de valor mais rápida, melhor desempenho e segurança mais forte, incentivando as organizações a adotar GenAI numa gama mais ampla de casos de utilização.
Os sistemas de Agentes Autônomos podem atingir objetivos sem intervenção humana, usando tecnologia de IA para identificar padrões, tomar decisões e gerar resultados. Brethenoux enfatizou que os agentes autônomos representam um grande salto nas capacidades de IA, que impulsionarão melhorias nas operações de negócios e na experiência do cliente, ao mesmo tempo que potencialmente levarão a uma mudança nos modelos de trabalho dentro das organizações, da execução para a supervisão.
Destaque:
Até 2027, 40% das soluções generativas de IA alcançarão a integração multimodal, um aumento significativo em relação a 2023.
Espera-se que a GenAI multimodal e os grandes modelos de linguagem de código aberto tragam vantagens competitivas significativas nos próximos cinco anos.
Os modelos GenAI específicos de domínio podem melhorar a precisão e a segurança dos aplicativos empresariais e incentivar uma adoção mais ampla.
Em suma, o rápido desenvolvimento da GenAI multimodal mudará profundamente as aplicações empresariais, e o LLM de código aberto e os modelos específicos de domínio também proporcionam às empresas mais opções e espaço de inovação. Embora os desafios permaneçam, o futuro da GenAI é promissor e os seus benefícios surgirão gradualmente à medida que a tecnologia amadurece. As empresas precisam de se adaptar ativamente a esta tendência para se manterem à frente da concorrência no futuro.