Последняя крупномасштабная языковая модель Meta, Code Llama 70B, как утверждается, имеет самый большой масштаб параметров и лучшую производительность, что привлекает широкое внимание в отрасли. Однако высокая стоимость оборудования стала основным препятствием для широкого использования разработчиками. Хотя модель показала отличную производительность в тестах, некоторые разработчики усомнились в ее производительности и обеспокоены тем, что аппаратная конфигурация, необходимая для ее работы, слишком требовательна и сложна для популяризации.
Meta выпустила Code Llama 70B, заявив, что у нее лучшая максимальная производительность, но разработчики в целом сообщали, что им трудно позволить себе высокие затраты на оборудование. Модель показала хорошие результаты в тесте, но некоторые разработчики отметили, что производительность не так хороша, как у других моделей, и были обеспокоены тем, достаточна ли конфигурация оборудования для удовлетворения эксплуатационных требований модели 70B.
Выпуск Code Llama 70B подчеркивает проблемы, с которыми сталкиваются при разработке больших языковых моделей: как найти баланс между производительностью и стоимостью. В будущем более экономичные методы обучения и развертывания моделей станут ключом к реальному продвижению технологии искусственного интеллекта на благо более широкого круга разработчиков и групп пользователей.