Действительно ли наступила эра приложений искусственного интеллекта?
Тема Всемирной конференции Baidu в этом году — «Приложения скоро появятся» — по состоянию на начало ноября среднее количество ежедневных вызовов крупной модели Baidu Wenxin превысило 1,5 миллиарда, что примерно в 30 раз больше по сравнению с 50 миллионами звонков, впервые объявленных за год. назад. Робин Ли сказал: «Эта крутая кривая роста отражает взрывной рост применения крупных моделей в Китае за последние два года».
Как самая распространенная форма применения ИИ, интеллектуальные агенты вот-вот достигнут критической точки, подчеркнул Робин Ли: «Они станут новым носителем контента, информации и услуг в эпоху ИИ».
Это потому, что «с одной стороны, порог создания агента достаточно низок; с другой стороны, потолок агента достаточно высок, чтобы создавать очень мощные приложения. Сотрудничество нескольких агентов также может решать более сложные проблемы. ." вопрос."
Робин Ли продемонстрировал на встрече 4 различных типа агентов, включая агентов компании, ролевых агентов, агентов-инструментов и отраслевых агентов. Среди них официальная информация компании, вероятно, заменит официальный сайт и станет наиболее прямым интерфейсом для потребителей.
«Агенты, подобные компаниям, эквивалентны официальным веб-сайтам компаний в эпоху искусственного интеллекта. Агенты, подобные компаниям, обладают всеми возможностями, которыми обладают традиционные официальные веб-сайты, такие как представление компаний, изображения продуктов и отображение параметров, расположение автономных магазинов и т. д. Но традиционные веб-сайты не имеют возможности активно давать рекомендации, возможности своевременного реагирования и индивидуального обслуживания также доступны в интеллектуальном агенте компании».
Робин Ли также выпустила инструмент без кода «Miaida» — программное обеспечение, состоящее из больших моделей и агентов, которые могут реализовать любую идею без написания кода, включая программирование без кода, многоагентное сотрудничество и масштабный вызов различных. другие возможности — это «самый сложный инструмент многоагентной совместной работы в истории человечества».
С помощью «Miaoda» пользователи могут завершить построение всей системы посредством взаимодействия на естественном языке, а также могут выполнять различные приложения в любом сценарии. Благодаря усовершенствованию базовых возможностей модели и развитию собственных технических возможностей Miaoda может стать больше. в будущем будут делаться более сложные вещи: «Это означает, что вам не нужно нанимать менеджеров проектов, дизайнеров, разработчиков, тестировщиков и т. д., вы можете направить нескольких агентов для совместного выполнения задач. Один человек может быть целым А». команда.
По словам Робина Ли, с Миаодой мы возвестим «эру, когда вы сможете зарабатывать деньги, просто полагаясь на идеи».
После того, как в сентябре бизнес Baidu Netdisk был реклассифицирован в Mobile Ecosystem Group (MEG) и на этой всемирной конференции его перенял Ван Ин, вице-президент Baidu и глава Baidu Library & Baidu Netdisk, Baidu The network disk и библиотека были дополнительно интегрированы.
Ван Ин поделился на конференции некоторыми новыми изменениями Baidu в производстве и потреблении контента. Она отметила, что в настоящее время создание и потребление контента сталкивается со многими проблемами, такими как сложные инструменты, длительные производственные циклы и низкая эффективность потребления. С этой целью Baidu Wenku и Netdisk внедрили технологию искусственного интеллекта, позволяющую преодолеть ограничения инструментов и модальных границ и добиться более свободного и эффективного взаимодействия с контентом.
Интеллектуальная генерация PPT Baidu Wenku, создание бумаги с использованием ИИ, производство книг с картинками с использованием ИИ, возможности поиска с помощью ИИ, а также создание романов и комиксов с помощью ИИ значительно повысили эффективность и качество производства контента, в то же время с точки зрения потребления контента была запущена Baidu Netdisk; Простые инструменты, такие как сканирование, простая диктовка и обобщение видео с помощью искусственного интеллекта, значительно облегчают пользователям обработку и понимание информации.
В частности, в офисных сценариях Baidu Wenku предоставляет интеллектуальные функции PPT, а также интеллектуальные исследования и отчеты, в то время как Baidu Netdisk имеет такие функции, как простые заметки для прослушивания, в сценариях обучения пользователи могут использовать интеллектуальные альбомы для рисования Baidu Wenku и поиск фотографий. Baidu Netdisk предоставляет вспомогательные инструменты обучения, такие как интерпретация видео и словарь Panpan, с точки зрения развлечений, Baidu Wenku предлагает умные романы и умные комиксы, а Baidu Netdisk имеет такие функции, как редактирование фотографий с помощью искусственного интеллекта. Интеграция Baidu Wenku и Netdisk расширяет сценарии применения пользователей, реализует интеллектуальность и диверсификацию контента, а также еще больше повышает удобство работы пользователей.
Бесплатная функция холста|Источник изображения: Baidu
Кроме того, Baidu Wenku и Netdisk совместно запустили новую контентную операционную систему Free Canvas. Эта система может помочь пользователям выполнять все задачи: от поиска информации до редактирования, создания и обмена. Она не только поддерживает полноформатный ввод и вывод в различных модальностях, но также позволяет использовать контент на уровне элементов, расширяя возможности создания и обмена. свобода.
По словам Робина Ли: «Свободный холст — это универсальная доска, благословленная мультимодальной большой моделью Вэньсиня». Эти инновации не только демонстрируют огромный потенциал технологии искусственного интеллекта в сфере контента, но и открывают новые возможности для производства и потребления контента в будущем.
На конференции Шен Доу, исполнительный вице-президент Baidu Group и президент бизнес-группы Baidu Intelligent Cloud, поделился последними достижениями Baidu Intelligent Cloud в области крупных моделей и собственных приложений искусственного интеллекта. Шэнь Доу сказал, что технология больших моделей переходит от технологических изменений к промышленным изменениям, переопределяя способы взаимодействия людей с цифровым и физическим миром и становясь ключевым элементом для предприятий, повышающим их конкурентоспособность.
Шэнь Доу сосредоточился на платформе Qianfan, которая представляет собой платформу для точной настройки крупных моделей и разработки приложений. Она предоставляет богатую цепочку инструментов и значительно снижает порог разработки собственных приложений для искусственного интеллекта. Платформа Qianfan не только отвечает требованиям настраиваемых, крупномасштабных, высокой доступности и безопасности приложений корпоративного уровня, но также выпускает агенты рабочих процессов. Это нововведение использует возможности глубокого понимания и обобщения больших моделей для превращения сложных рабочих процессов в гибких агентов, что значительно повышает эффективность предприятия. Например, компания China Pacific Insurance использовала платформу Qianfan для создания агента по продажам «золотой медали», что значительно повысило эффективность обслуживания и удобство для пользователей при продлении автострахования.
Baidu Smart Cloud Qianfan|Источник изображения: Baidu
Кроме того, платформа Baige предоставляет эффективные большие вычислительные услуги, связанные с моделями, от создания кластеров до обучения моделей и вывода, обеспечивая стабильную и чрезвычайно высокую производительность. Платформа решает ключевые проблемы крупномасштабного развертывания кластеров, поддерживает эффективную работу и удовлетворяет потребности различных клиентов в вычислительной мощности.
Шэнь Доу также продемонстрировал примеры применения платформы Qianfan в различных отраслях, включая общую диагностику, медицину, повышающую точность создания медицинских записей за счет точной настройки моделей и экономии времени врачей. State Grid изучает возможности применения искусственного интеллекта в энергетике на основе крупного проекта Wenxin; модели и добился замечательных результатов. Кроме того, обновление платформы XiLing 4.0 позволяет ей генерировать цифровые трехмерные изображения людей и создавать профессиональные видеоролики, что значительно снижает стоимость производства коротких видеороликов.
Baidu Intelligent Cloud создала новую инфраструктуру искусственного интеллекта с помощью платформ Qianfan и Baige, продвигая применение технологий больших моделей в различных отраслях для повышения уровня интеллекта и эффективности предприятий.
Помимо приложений, на этот раз Baidu также выпустила аппаратное обеспечение. На встрече Ли Ин, вице-президент Baidu Group и генеральный директор Xiaodu Technology, представил «первые собственные очки AI, оснащенные китайскими крупными моделями» — очки Xiaodu AI.
Очки Xiaodu AI|Источник изображения: Baidu
Ли Ин сказал, что способность очков искусственного интеллекта улавливать изображение, звук, местоположение и другую информацию в качестве устройства от первого лица для людей принесет беспрецедентное расширение чувств людей, а также станет более эффективным и удобным входом в человеко-компьютер. взаимодействие.
Основанный на большой модели Wenxin и собственной операционной системе DuerOS AI, Xiaodu AI может реализовывать такие функции, как съемка от первого лица, задавать вопросы во время ходьбы, распознавание калорий, энциклопедия распознавания объектов, аудиовизуальный перевод и интеллектуальные заметки.
Объединив устройство и облако с большими моделями, очки Xiaodu AI можно использовать независимо или в сочетании с приложением. Очки имеют встроенные китайские однострочные сообщения и могут отвечать на вопросы пользователей в режиме реального времени.
Что касается аппаратного обеспечения, очки Xiaodu AI оснащены решеткой из четырех микрофонов для распознавания звуков, открытым герметичным динамиком, 16-мегапиксельным сверхширокоугольным объективом и алгоритмом защиты от сотрясений AI; заряжается за 30 минут, обеспечивая 56 часов в режиме ожидания и более 5 часов непрерывного использования. Слушайте, вся машина весит всего 45 граммов, что ниже среднего показателя по отрасли (49 граммов).
Ожидается, что очки Xiaodu AI поступят в продажу в первой половине следующего года. Цена пока не объявлена, но сотрудники стенда сообщили, что цена может составить около 2000 юаней.
Робин Ли упомянул на встрече, что за последние 24 месяца индустрия искусственного интеллекта претерпела значительные изменения, наиболее заметным из которых является то, что большие модели практически устранили явление галлюцинаций. Это изменение превращает ИИ из первоначальной «серьезной чепухи» в полезный и заслуживающий доверия. Большая модель по сути является вероятностной моделью, и создаваемое ею содержимое имеет определенную степень неопределенности. Однако, используя технологию RAG, большие модели могут использовать полученную информацию для формирования текста или ответов, что значительно повышает качество и точность контента.
Чтобы решить проблему галлюцинаций при генерации изображений, в начале этого года Baidu разработала технологию — iRAG (RAG на основе изображений), которая представляет собой технологию графов Винсента с улучшенным поиском. До этого изображения, генерируемые винсентианскими графовыми системами, полностью основанными на больших языковых моделях, часто были низкого качества и даже нелогичными. Технология iRAG Baidu сочетает в себе ресурсы изображений Baidu Search на миллиарды уровней и мощные возможности базовой модели для создания множества ультрареалистичных изображений. Общий эффект намного превосходит родную систему Vincentian и устраняет следы машинной генерации.
Поскольку удобство использования изображений, созданных ИИ, значительно улучшилось, область их применения также значительно расширилась. Например, в сценарии продвижения бренда создание набора плакатов в прошлом могло стоить сотни тысяч юаней, но теперь затраты на создание практически равны нулю. Короче говоря, коммерческая ценность iRAG отражается в аспектах отсутствия иллюзий, ультрареализма, низкой стоимости и мгновенной доступности.
Робин Ли на конференции Источник изображения: Baidu
Когда базовые возможности модели созреют, наступит период процветания приложений ИИ. Итак, откуда берутся приложения ИИ и куда они пойдут? Есть два основных направления: одно — интеллектуальные агенты, другое — промышленное применение.
В будущем, возможно, когда действительно наступит период процветания приложений ИИ, ИИ сможет по-настоящему реализовать свою миссию «возможностей уровня промышленной революции» и обеспечить неограниченное расширение производительности в социальной экономике.