Новое исследование DeepMind показывает, что большие языковые модели могут превосходить людей-аннотаторов при фактической оценке. В исследовании используется оценщик SAFE для автоматической оценки фактов и проводится обширное сравнительное тестирование с набором данных LongFact, показывающее, что большая модель хорошо справляется с обработкой длинной фактической информации. Это исследование не только доказывает преимущества больших моделей в области фактической оценки, но, что более важно, команда DeepMind полностью открыла исходные коды всех результатов исследований, предоставляя ценные ресурсы для научных кругов и промышленности.
Последняя статья DeepMind раскрывает преимущества больших моделей при оценке фактов. Исследования показывают, что большие языковые модели могут превосходить производительность людей-аннотаторов и обеспечивать автоматическую оценку фактов с помощью оценщика SAFE. Исследователи провели обширное сравнительное тестирование с использованием набора данных LongFact, и результаты показали, что большая модель хорошо работает в отношении длинных фактических аспектов. Все исследование подчеркивает преимущества больших моделей при фактической оценке и имеет полностью открытый исходный код.Результаты этого исследования обнадеживают: оно не только способствует прогрессу искусственного интеллекта в области оценки фактов, но и обеспечивает новое направление для будущего применения больших моделей в области информационной надежности. Стратегия открытого исходного кода также открывает путь для более широких исследований и приложений, и стоит с нетерпением ждать дальнейшего развития.