5 сентября Шунь Сянъян, председатель Попечительского совета Гонконгского университета науки и технологий и иностранный академик Национальной инженерной академии, поделился своими восемью мыслями о внедрении крупномасштабной модельной индустрии на конференции 2024 Inclusion. ·Бундская конференция. Он считает, что наступление эры AI-агентов не станет волшебной и мощной моделью, которая внезапно заменит все рабочие процессы. Она предполагает непрерывную интеграцию технологий, проектирования и рынка и, наконец, предоставит людям услуги, превосходящие ожидания.
Мысль 1: Вычислительная мощность — это порог «Сегодня при создании больших моделей и глубоком обучении первое и самое важное — это наличие вычислительной мощности», — сказал Шэнь Сянъян. Он отметил, что с 2010 года вычислительная мощность, необходимая для больших моделей, выросла в 6–7 раз. За последние несколько лет он стабилизировался и ежегодно увеличивался примерно в 4 раза. Модель становится все больше и больше, количество параметров становится все больше и больше, а потребность в вычислительной мощности также растет в горизонтальном направлении по мере увеличения параметров. По его мнению, развитие всей индустрии компьютерных чипов изменилось с первоначального «Закона Мура» на «Закон Хуана». Закон Мура раньше гласил, что вычислительная мощность удваивается каждые 18 месяцев. Сейчас прогнозируется, что графические процессоры будут способствовать удвоению вычислительной мощности ИИ с каждым годом. «Разговоры о картах ранят чувства, но эмоций нет, если у тебя их нет. Раньше говорили, что бедность ограничивает воображение, но теперь бедность может исказить воображение, потому что, если нет карт, проекты, которые Можно себе представить, что все может быть по-другому, — вздохнул Шэнь Сянъян от волнения. Публичная информация показывает, что данные обучения GPT3 достигли токена (пропускной способности) 2 T, а GPT4 — около 12 T. По прогнозу Шуня Сянъяна, обучающие данные GPT5 могут достигать 200 Т. Текущие данные в Интернете далеки от удовлетворения потребностей будущего обучения моделей, и нам нужно подумать о способах сбора большего количества данных. В области искусственного интеллекта данные рассматриваются как «топливо» модели, и модели необходимо обучаться и извлекать полезную информацию из этих данных. Следовательно, количество, качество и разнообразие данных будут напрямую влиять на точность и производительность модели. Шэнь Сянъян сказал, что в прошлом Google, являясь основным хранилищем данных в Интернете, использовался для создания поисковых систем. В будущем эти данные будут использоваться для обучения больших моделей. «Данные, накопленные Интернетом за последние 40 лет, похоже, предназначены как раз для такого момента ИИ». Мысль 3: следующая глава большой модели Что дальше? Шэнь Сянъян считает, что будущий путь развития индустрии больших моделей очень ясен, и в будущем она перейдет от предыдущей большой языковой модели к мультимодальной модели и к мировой модели. Говоря технически, мы должны пойти по пути объединения понимания и порождения. «Будущее определенно движется в сторону воплощенного интеллекта и роботов. Одной из особых форм является автономное вождение», — сказал Шэнь Сянъян. Фактически в отрасли не существует стандартного определения модели мира. Модель сора, представленная OpenAI, вызвала дискуссии о «мировой модели» в отрасли. OpenAI рассматривает его как основу для моделей, способных понимать и моделировать реальный мир, и считает, что его возможности являются важной вехой в достижении AGI (общего искусственного интеллекта). Однако Шун Сянъян считает, что «хотя модель Сора очень хороша, она не так уж сильна. Физические свойства в ней не могут быть гарантированы, и она не может быть моделью мира». Мысль 4: Большие модели охватывают тысячи отраслей Большие модели можно разделить на большие модели общего назначения, большие отраслевые модели, большие модели предприятия и большие персональные модели. Шэнь Сянъян отметил, что большие модели общего назначения являются основой ИИ, и для обучения большой модели общего назначения требуется не менее 10 000 калорий; крупные отраслевые модели являются основой для предметных приложений и требуют обучения на уровне крупных корпоративных моделей; повторное открытие ценности корпоративных данных требует сотен калорий на обучение. Эти большие модели предъявляют чрезвычайно высокие требования к вычислительной мощности. «Самое интересное — это крупномасштабная персональная модель. Например, Lenovo и Microsoft продвигают AIPC, а компания Apple Intelligence развивается в направлении персонального интеллекта», — сказал Шэнь Сянъян. По состоянию на конец июля этого года в Китае зарегистрировано 197 крупных моделей, из которых 30% — крупные модели общего назначения, а 70% — крупные отраслевые модели. «Видно, что крупные модели в отрасли составляют подавляющее большинство, и в будущем их определенно будет все больше и больше», — сказал Шэнь Сянъян. Мысль 5: ИИ-агент — от концепции до реализации В мае 2024 года основатель Microsoft Билл Гейтс публично заявил, что AI Agent не только изменит способ взаимодействия каждого с компьютером, но также разрушит индустрию программного обеспечения и вызовет величайшую компьютерную революцию с момента ввода команд до нажатия значков. Шунь Сянъян согласился с этой точкой зрения. Он считает, что в эпоху искусственного интеллекта поистине удивительным суперприложением является AI Agent. В процессе разработки AI Agent от видения до реализации необходимо всегда концентрироваться на потребностях, глубоко понимать возможности модели и строить рабочий процесс с глубоким участием ИИ. «Если вы сегодня работаете в компании, весь рабочий процесс очень сложен. Хотя ChatGPT очень мощный, он далек от уровня агента. Он позволяет добиться лишь одного прорыва. Чтобы по-настоящему двигаться вперед, его необходимо интегрировать в весь рабочий процесс», — сказал он. Мысль 6: Обратите внимание на управление ИИ Управление ИИ очень важно. Тема Всемирной конференции по искусственному интеллекту (WAIC) в этом году посвящена управлению ИИ. В разных странах существуют разные взгляды на этот вопрос. Развитие ИИ оказало сильное влияние на людей, компании, государственный надзор, социальное развитие и другие аспекты, а также вызвало обеспокоенность общественности по поводу управления его безопасностью. «Я думаю, что следующий важный момент в развитии искусственного интеллекта. С точки зрения различных стран мира, необходимо создать суверенный искусственный интеллект, а за суверенным искусственным интеллектом должно стоять суверенное облако для поддержки развития суверенного искусственного интеллекта. искусственный интеллект», — выразил мнение Шэнь Сянъян. Мысль 7: Переосмыслите отношения человека и машины «В какой степени влияние GPT является шоком от взаимодействия человека с компьютером, а в какой степени — развитие машинного интеллекта?» Шэнь Сянъян считает, что отношения между людьми и машинами следует переосмыслить. Он отметил, что ИИ предоставляет людям новый контекст для симбиоза с технологиями, а новый способ взаимодействия человека и компьютера указывает на интеграцию и прогресс «ИИ и IA». IA (Intelligent Augmentation) представляет собой путь развития ИИ, ориентированный на человека. Он фокусируется на использовании технологий для расширения человеческих возможностей, а не для замены людей, подчеркивая отношения сотрудничества между людьми и ИИ. «Колумнист New York Times Джон Маркофф отметил, что в развитии компьютеров за последние несколько десятилетий настоящим победителем было взаимодействие человека и компьютера. Независимо от того, какая технология, конечной целью должно быть помочь людям лучше использовать машины. Шэнь Сян Ян сказал: «В эпоху искусственного интеллекта наиболее важным аспектом взаимодействия человека и компьютера является диалог, как и ChatGPT. Станут ли ChatGPT вместе с Microsoft величайшей компанией в эпоху искусственного интеллекта, я думаю, только время?» рассказывать." Мысль 8: Природа интеллекта Сегодня развитие GPT идет полным ходом, но на самом деле понимание людьми интеллекта все еще очень ограничено. В отличие от физики, все, от огромного звездного неба до крошечных квантов, можно объяснить с помощью единой теории; многие вещи в современном глубоком обучении необъяснимы и не обладают надежностью. «Суть интеллекта — это вековая битва между нейронными сетями и системами символов», — сказал Шэнь Сянъян: «Сегодня, хотя развитие искусственного интеллекта все еще находится на относительно ранней стадии, в отрасли уже существует множество приложений, которые достойны того, я полон решимости сделать это и уверен в будущем».