Большие модели этого года были чрезвычайно оживленными в первой половине года, но немного прохладными во второй половине.
Проведение крупномасштабных исследований и разработок низкоуровневых моделей похоже на длительный марафон с высокими затратами на исследования и разработки, высокими техническими порогами и жесткой конкуренцией за итерации. Возьмем, к примеру, OpenAI: ее ежегодные убытки от исследований и разработок достигают 5 миллиардов долларов. Такое финансовое давление, очевидно, не то, что могут вынести обычные компании, занимающиеся искусственным интеллектом. Стартапы в области искусственного интеллекта также, как правило, очень прагматичны, всегда рассматривая коммерциализацию и получение прибыли в качестве основных соображений.
ИИ находится на пути к поиску собственного применения, и генерацию видео можно рассматривать как один из путей, наиболее близких к его применению. Однако сегодня генеральный директор Runway, «ведущей» компании, генерирующей ИИ-видео, «приговорил к смерти» ИИ-компанию. В его открытом письме первый абзац гласит: «Я думаю, что эра компаний, занимающихся искусственным интеллектом, закончилась».
Соучредитель и генеральный директор Runway Кристобаль Валенсуэла Баррера
Полный текст письма следующий:
Runway не занимается искусственным интеллектом. Runway — медиа- и развлекательная компания. На самом деле, я думаю, что эпоха компаний, занимающихся искусственным интеллектом, закончилась.
Это происходит не потому, что ИИ потерпел неудачу (как раз наоборот), а потому, что ИИ становится такой инфраструктурой, как электричество или Интернет. Сегодня называть себя компанией, занимающейся искусственным интеллектом, — это все равно, что называть себя интернет-компанией в 2024 году. Это не имеет смысла, потому что его используют все — каждая компания использует Интернет, каждая компания будет использовать искусственный интеллект;
Что касается Runway, мы фокусируемся на искусстве, средствах массовой информации и более широком секторе развлечений. Видение, которое мы запустили «Подиум» семь лет назад, остается неизменным: искусственный интеллект — важный инструмент для рассказывания историй. Чтобы реализовать это видение, нам пришлось сделать обратное и создать лучшую исследовательскую группу, которая будет разрабатывать лучшие модели для поддержки лучших продуктов.
Я часто сравниваю нашу работу с новым типом «камеры». «Камера» здесь не буквально фиксирует изображения, а скорее относится к более долгосрочному историческому масштабу. Камера не просто создала фотографию — она породила целые отрасли, экономики и формы искусства. Кино, телевидение, TikTok — все началось с этого революционного инструмента, улавливающего свет и время.
Я думаю, что работа Runway закладывает основу для совершенно нового медиа-ландшафта. Точно так же, как камеры изменили способ захвата реальности, искусственный интеллект меняет способ создания реальности. Модели и технологии, созданные Runway, — это только начало: они являются эквивалентом оригинальных дагерротипов, сырыми, но полными возможностей.
Дагерротипия — ранняя техника фотографии, изобретенная в 1839 году французом Луи Дагером.
Многие люди ошибочно считают искусственный интеллект конечной целью. Они ошибаются. ИИ — это всего лишь инструмент и способ поддержать большие достижения. Настоящая революция заключается не в самой технологии, а в том, что она может сделать: создание новых форм выражения, открытие новых способов рассказывания историй и поиск новых способов подключения к человеческому опыту.
Традиционные СМИ подобны улице с односторонним движением. Творения доходят до потребителей по установленным каналам. Даже если распространение сначала будет нарушено социальными сетями, а затем потоковыми медиа, базовая модель все равно существует: одни люди создают, другие потребляют. Роли ясны и границы ясны. Однако сейчас мы наблюдаем совершенно новую ситуацию.
Представьте, что шоу, которое вы смотрите, автоматически генерируется по мере его просмотра — по-настоящему динамичный контент, который реагирует на вас, понимает вас и полностью адаптирован к вам. Аналоговые миры, которые позволяют контенту формироваться в реальном времени, могут стирать границы между созданием и распространением. Это не только основа для построения нового медиа-ландшафта, но и фундаментально переопределит медиа: они интерактивны, генеративны и персонализированы, но также являются общими и универсальными.
Вот почему компании, занимающиеся чистым ИИ, устаревают. Фундаментальный вопрос, на который сейчас необходимо ответить, — это уже не просто технология: что мы можем создать с помощью технологий? Следующая волна инноваций исходит не от компаний, которые фокусируются на исследовательских моделях. Модели стали товаром. Техническая база теперь прочная, и в отрасли нет никаких секретов. Настоящие перемены произойдут благодаря тем, кто знает, как использовать эти инструменты для создания новых медиаформ, нового опыта и новых повествований. Инфраструктура заложена, и следующим шагом будет использование ИИ для создания значимых вещей.
Конец компаний, занимающихся искусственным интеллектом, знаменует собой новое начало: рождение новых средств массовой информации. Это не просто новая платформа или формат, это совершенно новый способ создания и использования контента. Мы больше не стремимся создавать компанию, занимающуюся искусственным интеллектом. Это более захватывающая миссия, такая же, как и то, что всегда преследовал Runway: возвращение к нашему первоначальному замыслу.
«Лошадиная» взлетно-посадочная полоса
Компания Runway была основана в 2018 году. Основатель и генеральный директор Кристобаль Валенсуэла Баррера считает, что искусственный интеллект имеет большой потенциал в сфере художественного творчества. Поэтому с момента своего создания Runway стремится предоставлять инструменты и платформы для дизайнеров, художников и разработчиков.
Команда основателей Runway: слева направо: Алехандро Матамала, Кристобаль Валенсуэла Баррера, АнастАСИс Германидис
Оглядываясь назад на историю разработки Runway, мы обнаружим несколько инцидентов, связанных с «захватом лошадей»: команды, стоящие за Stable Diffusion, были в разногласиях друг с другом, а библиотека HuggingFace была внезапно удалена...
Когда сегодня упоминается Stable Diffusion, мы можем подумать, что это исследовательская работа Stability AI, но на самом деле техническим источником этой модели является статья «Синтез изображений высокого разрешения с моделями скрытой диффузии», опубликованная в CVPR 2022, подписанная Всего пять авторов из Мюнхенского университета, Гейдельбергского университета и Runway. В 2022 году Runway официально объявила о выпуске Stable Diffusion v1.5 и имела конфликт со Stability AI из-за проблем с авторскими правами Stable Diffusion.
В конце августа этого года Runway внезапно удалила и удалила весь свой контент на HuggingFace, включая Stable Diffusion v1.5. На домашней странице Hugging Face Runway заявляет, что больше не поддерживает HuggingFace.
Хотя эти инциденты несколько сбивают с толку, Runway продолжает прилагать усилия в области визуальной генерации. Например, Gen-3 Alpha, базовая модель для создания видео, недавно выпущенная компанией Runway, может создавать видео высокой четкости со сложными изменениями сцен, несколькими стилями фильма и подробным художественным руководством.
Недавно Gen-3 Alpha также выпустила новую функцию — Act-One, которая позволяет пользователям загружать видео, чтобы заставить видеоперсонажа совершать те же выражения и действия, что, можно сказать, подорвало индустрию захвата движений.
Если «эра компаний искусственного интеллекта закончилась», то Runway, похоже, создает инструменты и ценности в искусстве, средствах массовой информации и в более широких сферах развлечений. Возможно, как сказал генеральный директор, ИИ в будущем станет инфраструктурой, и больше всего стоит задуматься и изучить направления применения ИИ.
Согласны ли вы с мнением генерального директора Runway?