Anthropic объявила об амбициозном плане по финансированию разработки новых эталонных моделей искусственного интеллекта. Программа направлена на улучшение оценки эффективности и воздействия модели ИИ, уделяя особое внимание таким важным аспектам, как безопасность ИИ и социальное воздействие. Этот шаг направлен на устранение недостатков существующих тестов, таких как их неспособность эффективно охватить сценарии реальных приложений и их неспособность точно измерить то, что они якобы измеряют. Anthropic призывает к разработке более сложных тестов для оценки возможностей моделей ИИ в кибератаках, усовершенствовании оружия, манипулировании информацией и т. д., а также для изучения потенциала ИИ в научных исследованиях, многоязычном общении и других областях. Это поможет обеспечить более полное понимание возможностей и рисков ИИ и будет способствовать развитию области безопасности ИИ.
Anthropic будет оказывать финансовую поддержку сторонним организациям, чтобы побудить их разрабатывать более эффективные методы оценки. Эта программа отражает стремление Anthropic улучшить общую область безопасности ИИ и продвигать комплексную оценку ИИ в качестве отраслевого стандарта. Однако, учитывая собственные деловые интересы Anthropic, объективность и справедливость ее плана все еще нуждаются в дальнейшем рассмотрении. В будущем успех программы будет зависеть от вложения средств и людей, а также степени сотрудничества с другими соответствующими организациями.