Цуй Линлин, генеральный директор отдела патентных дел Baidu Group, опубликовал «Десять лучших технологических передовых изобретений Baidu в 2024 году»: передовые запатентованные изобретения Baidu в области искусственного интеллекта, охватывающие всесторонние прорывы от базовых алгоритмов до приложений. сценарии. Согласно «Отчету об анализе патентных технологий искусственного интеллекта нового поколения», опубликованному Национальным исследовательским центром развития промышленной информационной безопасности и Центром электронной интеллектуальной собственности Министерства промышленности и информационных технологий в апреле этого года, по состоянию на конец 2023 года Baidu подала заявку на 19 308 патентов во всей области искусственного интеллекта и выдала 9 260 патентов. Baidu занимает первое место в Китае в течение шести лет подряд в области искусственного интеллекта нового поколения, в основе которого лежат большие модели, Baidu подала заявку на 1 432 патента и разрешила 651 патент. стать лидером в области технологических инноваций и патентного оформления. Согласно данным патентного ландшафта генеративного искусственного интеллекта, опубликованным организацией патентных баз данных IFIclaims, патентные заявки Baidu на генеративный искусственный интеллект входят в десятку лучших в мире. Это единственная китайская инновация, вошедшая в этот список, а запатентованная технология охватывает текст. , изображение, голос и видео. В большой базовой области она стала одной из четырех компаний в мире, обладающих комплексным подходом в этих четырех областях.
12 ноября в Шанхае пройдет Baidu World 2024 по теме «Приложения здесь». В качестве громкой технологической конференции года Baidu также опубликует свои последние результаты, снова представив привлекательные технологические прорывы и запуск новых продуктов.
Десять лучших передовых технологических изобретений Baidu в 2024 году выглядят следующим образом:
1. Агентная технология на основе генеративных больших моделей.
Эта технология изобретения инновационно представляет модель мышления, позволяющую агенту иметь множество возможностей, таких как планирование задач, вызов инструментов, расширение знаний и рефлексивная эволюция. Благодаря систематическому проектированию и направленной оптимизации основных возможностей он может поддерживать крупномасштабное создание и развертывание агентов в различных сценариях применения с низкими затратами за счет создания возможностей крупномасштабного моделирования, что может ускорить создание и распространение агентов; Эта техническая система успешно использовалась во многих ключевых сценариях, таких как Wenxin Intelligent Platform, Merchant Intelligent Agent, Wenxin Quick Code и т. д., что значительно повысило эффективность исследований и разработок интеллектуальных агентов и снизило порог исследований и разработок. Среди них торговые агенты используют технологию планирования + экспертную многомодельную сотрудничество и технологию крупномасштабного моделирования, чтобы улучшить свои способности размышлять, развивать и использовать инструменты, а также создавать маркетинговые возможности AI Wenxin Kuaicode полагается на рекомендации по коду и системы агентов для интеграции с ними; Традиционный DevOps. Органичное сочетание цепочек инструментов способствует углубленному исследованию и внедрению совместного парного программирования «человек-машина».
2. Технология мультимодели коэволюции, основанная на эффективной системе обучения больших моделей.
Эта изобретательная технология позволяет преодолеть ряд сложных проблем как с инженерной, так и с алгоритмической точки зрения. С точки зрения инженерной архитектуры, всесторонние инновационные прорывы включают гибридные параллельные стратегии, эффективность связи, а также оптимизацию вычислений и хранения, которые значительно улучшают производительность обучения больших языковых моделей и поддерживают эффективное и стабильное обучение всей серии моделей Wenxin на протяжении всего процесса разработки. процесс. Что касается стратегий алгоритмов, мы разработали технологию предварительного обучения для совместной работы больших и малых моделей, преодолевая техническую проблему сложного наследования знаний между моделями, изменяя парадигму обучения традиционных моделей и снижая стоимость обучения новых моделей. На основе этого изобретения были построены технические барьеры для моделей различных размеров, что увеличило производительность обучения большой модели Вэньсиня в 4,1 раза за последний год, что помогло Вэньсинь Ияну эффективно удовлетворять широкий спектр предприятий с различными потребностями и расширить возможности. тысячи отраслей.
3. Интеллектуальная система, объединяющая создание и компиляцию мультимодального контента на основе больших моделей и технологии улучшения поиска знаний.
Технология этого изобретения комплексно использует такие технологии, как расширение знаний, анализ контента из нескольких источников, интегрированное редактирование и расширенный поиск лексики для решения таких проблем, как низкое качество производства профессиональных длинных статей и мультимодального контента, невозможность совместного использования контейнеров при создание и редактирование, а также недостаточная точность основной части словаря. Поиск улучшенных текстовых изображений направлен на адаптивную обработку эталонных изображений посредством интеллектуального определения потребностей пользователя. Система генерации изображений в смешанном режиме значительно улучшает согласованность основной части изображения, эффективно компенсируя недостатки неточного описания контента с длинным хвостом. В целом эффект намного превосходит родную систему Вэньшэнту. Baidu Wenku добилась больших успехов в создании отчетов об отраслевых исследованиях, презентаций, интеллект-карт и комиксов в реальном времени на основе инструкций пользователя и загруженного контента, а также поддерживает сложные задачи, такие как универсальное редактирование, кросс-модальное преобразование и общие/ Персонализированные рисунки Значительное улучшение производительности. В августе 2024 года компания Yuehu Data из Aurora опубликовала отчет, показывающий, что доля рынка интеллектуальных PPT Baidu Wenku достигла 80%. За последние три месяца совокупный темп роста масштаба пользователей достиг 23%, и этот темп роста намного превышает отраслевой уровень. .
4. Поддержка крупномасштабного автономного позиционирования вождения и технологии создания карт на уровне полосы движения.
Эта изобретательная технология решает проблемы эффективности и стоимости традиционной модели, снижает стоимость производства карт на 95% и имеет пробег по полосам дороги более 3,6 миллиона километров, обеспечивая полное покрытие более 41 000 городских и сельских дорог. города по всей стране. Технология высокоточного позиционирования для автономного вождения, основанная на объединении мультимодальных датчиков, дополнительно созданная на основе картографических данных, имеет точность на уровне сантиметра, что значительно улучшает массовое производство и уменьшает объем пакета карт, от которого зависит позиционирование на стороне транспортного средства, на 97,5%, а надежность достигает 99,9999%, полностью поддерживая текущую крупномасштабную эксплуатацию полностью автономного вождения Luobo Kuaipao и реализуя полностью автономное вождение в различных сложных и трудных сценариях, таких как под виадуками, многоуровневыми дорогами и туннелями.
5. Персонализированный механизм памяти для интеллекта больших моделей.
Эта технология изобретения новаторски предлагает комплексный набор механизмов памяти, охватывающий пять модулей обработки, хранения, управления, запуска и использования памяти, что дает крупным моделям персонализированные возможности памяти. Обработка памяти опирается на механизм гиппокампа человека для достижения глубокого понимания и точной обработки пользовательской информации во всех сценариях. Управление памятью поддерживает активное добавление, удаление и модификацию пользователей, а также автоматическое добавление, удаление и модификацию системы, обеспечивая реалистичность; обновление времени и точность банка памяти; запуск и использование памяти. Помогайте большим моделям генерировать более антропоморфные и персонализированные ответы посредством спекулятивной генерации соответствующих воспоминаний. Технология этого изобретения широко использовалась в таких сценариях, как интеллектуальные помощники ИИ и цифровые люди.
6. Суперреалистичная цифровая система моделирования, вождения и генерации человека на основе больших моделей.
Эта изобретательная технология предлагает полный набор сверхреалистичных цифровых решений для моделирования, вождения и генерации информации о человеке. Для настоящих цифровых людей мы разработали модели портретного моделирования на основе данных, кросс-модального вождения и создания больших портретных видео для достижения естественного и реалистичного создания цифрового человеческого контента. Мы поддерживаем исключительно клонирование живых портретов в крупномасштабных сценах с действием и окклюзией, а также. Была реализована первая комната для прямых трансляций с интеллектуальным управлением всего тела. Для гиперреалистичных 3D-цифровых людей мы разработали технологии модальной миграции и многоагентной совместной работы на основе большой модели Wenxin, достигая мельчайшего производства гиперреалистичных цифровых изображений людей и оперативного контента, которые можно сравнить с кино- и телевизионными блокбастерами и 3А игры. Технология настоящего изобретения широко использовалась во многих продуктах для реальных людей и трехмерных цифровых человеческих продуктов, таких как цифровое прямое вещание людей, видеопроизводство и интеллектуальные тела.
7. Генеративная коммерческая поисковая система на основе больших моделей.
Технология этого изобретения изменила традиционный процесс «индекс-вызов-сортировка», упростила системную воронку, сократила потери информации и закодировала бизнес-информацию в параметры модели путем создания задач обучения индексу для достижения «модели как индекса» и использования возможностей больших Возможности понимания и рассуждения моделей, реализации «генерации и поиска», новая парадигма значительно повышает эффективность ориентации системы на 120%. Проект, связанный с этим изобретением, был первым реализованным в отрасли и реализовал крупномасштабное промышленное применение. Генеративная большая модель была объединена со сценариями коммерческого поиска для достижения множества технологических инноваций. Творческое богатство увеличилось в 37 раз, а творческое качество. увеличился на 92%, были достигнуты значительные преимущества для бизнеса и широкий спектр технического влияния.
8. Технология маховика данных большой модели
Эта изобретенная технология автоматически выявляет дефекты модели и эффективно синтезирует высококачественные разнообразные обучающие данные путем интеграции информации из различных источников и форм, таких как отзывы пользователей, отзывы об исполнении и отзывы с самоконтролем. В то же время метод обучения с подкреплением в сочетании с обратной связью из нескольких источников значительно улучшает эффект обучения модели. Эта инновационная технология создает маховик данных, который может постоянно совершенствоваться, эффективно устраняя узкие места в данных больших моделей, сокращая затраты на сбор данных, улучшая адаптируемость и надежность больших моделей, а также улучшая производительность модели в различных сценариях задач. непрерывная эволюция больших моделей.
9. Технология эффективного вывода больших моделей
Эффективная технология рассуждения, предложенная этой технологией изобретения, базовый уровень модели основан на платформе Flying Paddle Framework. В направлении архитектуры рассуждений продолжаются инновации в направлении основного префиксного кэширования, просмотра вперед, PagedAttention, разделения PD и т. д. и эффективно сочетает различные технологии для значительного повышения производительности и производительности модели. Что касается сжатия больших моделей, компания применяет технологию квантования без потерь для больших моделей и активирует такие методы, как адаптивное сглаживание сегментации и перестановку весовой привязки. Она первой в отрасли достигла эффективного сжатия без потерь больших моделей размером в десятки миллиардов и сотен. миллиарды. Это изобретение поддерживает различные методы сжатия больших моделей и ускорения вывода и использовалось в основных сферах бизнеса, таких как платформа больших моделей Baidu Intelligent Cloud Qianfan, чтобы снизить потребление ресурсов для вывода моделей, сэкономить затраты на развертывание больших моделей более чем на 50% и улучшить производительность модели и пропускную способность модели. Улучшено в 3-5 раз.
10. Система генерации поиска, основанная на обратной связи с пользовательскими данными.
Система генерации поиска, предлагаемая этой изобретательной технологией, может комбинировать сигналы обратной связи о поведении пользователя для достижения быстрого самоподкрепления. Непосредственное согласование предпочтений пользователей посредством моделирования удовлетворенности и обучения с подкреплением, а также использование отзывов пользователей для запуска быстрого анализа системы, решение проблем низкой эффективности обратной связи с экспертами и трудностей моделирования предпочтений пользователей в традиционных приложениях обработки данных. Система генерации поиска, основанная на этой платформе, покрывает 18% поискового трафика и широко используется в текстовых, видео, графических и других сценариях поиска. Масштабные и перерабатываемые характеристики обратной связи от множества пользователей позволяют системе быстро адаптироваться к изменениям в данных, продуктах и окружающей среде, помогают системе автоматически искать оптимизацию и ускоряют эволюцию системы до идеального состояния. Это имеет чрезвычайно высокую практическую ценность и имеет чрезвычайно высокую практическую ценность. рыночная конкурентоспособность.