Недавно Mistral, отечественная крупномасштабная модель, выпущенная Университетом Цинхуа, вызвала восторженные отклики на GitHub. Ее размер 2B имеет производительность, превосходящую многие «крупномасштабные» модели, и это удивительно. Это отражается не только в его высокой производительности, но и в чрезвычайно низкой стоимости: стоимость вывода в 1 700 000 токенов может быть получена всего за 1 юань, что намного ниже, чем у аналогичных продуктов. Кроме того, Mistral также обладает мультимодальными возможностями, что демонстрирует большой потенциал применения. Этот инцидент еще раз доказывает, что в области искусственного интеллекта одинаково важны отличный дизайн моделей и контроль затрат, а не просто «объем решает».
В статье основное внимание уделяется:
Недавно факультет Университета Цинхуа выпустил Mistral отечественного производства. Эта большая модель размером всего 2B неожиданно получила теплый прием на GitHub и за один день получила более 300 звезд. С точки зрения производительности этот продукт вполне конкурентоспособен. Существует большой контраст между производительностью и размером. По многим достижениям он превзошел многие распространенные модели большого объема. Аспект стоимости еще более удивителен: получение 1 700 000 токенов стоит всего 1 юань по стоимости вывода. По сравнению с аналогичными продуктами стоимость намного ниже. Помимо вышеперечисленных функций, продукт также обладает мультимодальными возможностями и показывает отличные результаты.
Успех «Мистраля» демонстрирует прорыв в характеристиках и стоимости отечественных больших моделей, а также дает новые идеи по направлению развития больших моделей в будущем. Я верю, что в будущем мы увидим больше подобных сюрпризов, способствующих постоянному прогрессу технологий искусственного интеллекта.