Последний прогноз Gartner показывает, что сфера генеративного искусственного интеллекта (GenAI) претерпевает беспрецедентные изменения. К 2027 году мультимодальные решения GenAI будут занимать 40% рынка, а это означает, что ИИ сможет обрабатывать несколько типов данных, таких как текст, изображения, аудио и видео одновременно, что окажет огромное влияние. в корпоративных приложениях. В этой статье мы углубимся в прогнозы Gartner и проанализируем будущие тенденции развития мультимодальных GenAI, моделей больших языков с открытым исходным кодом (LLM) и предметно-ориентированных моделей GenAI, а также возможности и проблемы, которые они приносят предприятиям.
На недавнем ИТ-симпозиуме Gartner аналитики поделились убедительным прогнозом: к 2027 году 40% решений генеративного искусственного интеллекта (GenAI) будут мультимодальными, способными обрабатывать текст, изображения, аудио и видео. Эта доля резко выросла по сравнению с 1% в 2023 году. Это изменение окажет глубокое влияние на корпоративные приложения.
Примечание к источнику изображения: изображение генерируется искусственным интеллектом и разрешено поставщиком услуг Midjourney.
Эрик Бретену, старший вице-президент Gartner, отметил, что по мере развития рынка GenAI в сторону мультимодальных моделей это поможет уловить взаимосвязи между различными потоками данных и потенциально расширить преимущества GenAI для различных типов данных и приложений. Он подчеркнул, что мультимодальный GenAI может помочь людям выполнять больше задач в различных средах.
Согласно отчету Gartner о цикле бума технологий генеративного искусственного интеллекта за 2024 год, мультимодальный GenAI и модели большого языка с открытым исходным кодом (LLM) считаются чрезвычайно влиятельными и, как ожидается, принесут предприятиям значительные конкурентные преимущества и скорость реакции рынка в ближайшие пять лет. . Gartner также отметил, что в течение следующего десятилетия ожидается, что специализированные модели GenAI и автономные агенты получат широкое распространение.
Аналитик Арун Чандрасекаран отметил, что компаниям будет сложно ориентироваться в экосистеме GenAI, поскольку технологии и среда поставщиков быстро меняются. Хотя GenAI в настоящее время переживает «корыто разочарования», поскольку начинается консолидация отрасли, реальные преимущества появятся после того, как шумиха утихнет, а возможности будут быстро расширяться.
Трансформация мультимодального GenAI улучшит корпоративные приложения и предоставит больше новых функций. Многие мультимодальные модели в настоящее время ограничиваются двумя или тремя модальностями, но ожидается, что в ближайшие годы это разнообразие увеличится. Бретену отметил, что в реальной жизни люди понимают информацию посредством сочетания звука, зрения и ощущений, поэтому мультимодальный GenAI имеет решающее значение.
Что касается модели большого языка с открытым исходным кодом, Чандрасекаран отметил, что она предоставляет предприятиям потенциал для инноваций и может снизить зависимость от конкретных поставщиков за счет настройки, контроля конфиденциальности и безопасности, прозрачности модели и т. д. В конечном счете, LLM с открытым исходным кодом может предоставить более мелкие и простые в обучении модели, помогающие основным бизнес-процессам предприятий.
Специализированные модели GenAI оптимизированы для конкретных отраслей или задач, улучшая согласованность сценариев использования внутри предприятия и повышая точность и безопасность. Чандрасекаран далее заявил, что эти модели могут обеспечить более быструю реализацию ценности, лучшую производительность и более высокий уровень безопасности, что побуждает организации внедрять GenAI в более широком диапазоне вариантов использования.
Системы автономных агентов могут достигать целей без вмешательства человека, используя технологию искусственного интеллекта для выявления закономерностей, принятия решений и получения результатов. Бретену подчеркнул, что автономные агенты представляют собой крупный скачок в возможностях ИИ, который будет способствовать улучшению бизнес-операций и качества обслуживания клиентов, а также потенциально приведет к сдвигу в моделях работы внутри организаций от исполнения к надзору.
Выделять:
К 2027 году 40% генеративных решений искусственного интеллекта будут иметь мультимодальную интеграцию, что значительно больше, чем в 2023 году.
Ожидается, что мультимодальный GenAI и модели больших языков с открытым исходным кодом принесут значительные конкурентные преимущества в течение следующих пяти лет.
Модели GenAI, ориентированные на предметную область, могут повысить точность и безопасность корпоративных приложений и способствовать более широкому внедрению.
В целом, быстрое развитие мультимодального GenAI глубоко изменит корпоративные приложения, а LLM с открытым исходным кодом и модели, специфичные для предметной области, также предоставят предприятиям больший выбор и пространство для инноваций. Хотя проблемы остаются, будущее GenAI многообещающее, и его преимущества будут постепенно проявляться по мере развития технологии. Компаниям необходимо активно адаптироваться к этой тенденции, чтобы оставаться впереди конкурентов в будущем.