Tencent는 모델 일반화 및 정확성을 향상시키기 위해 대형 언어 모델 교육을위한 새로운 특허를 출시합니다 - AI 기사

저자：Eve Cole 업데이트 시간：2025-02-14 18:16:01

인공 지능 기술의 빠른 발전으로 주요 기업은 R & D 투자를 늘리고 기술 혁신을 촉진했습니다. 최근 Tencent Technology (Shenzhen) Co., Ltd.는 대형 언어 모델 교육에서 상당한 진전을 보였으며 관련 특허를 신청하고 게시했습니다.

최근 Tencent Technology (Shenzhen) Co., Ltd.는 Tianyancha 앱에서 대형 언어 모델의 교육 방법 및 관련 장비에 대한 특허를 발표했습니다. 이 특허의 이름은 "대형 언어 모델을위한 교육 방법, 장치, 컴퓨터 장비 및 스토리지 미디어"이며 혁신적인 교육 방법을 통해 대형 언어 모델의 학습 능력과 정확성을 향상시키는 것을 목표로합니다.

대형 언어 모델의 훈련 과정에서 전통적인 방법은 종종 단일 텍스트 요약에 의존하여 모델에과 적합성을 가져오고 생성 된 컨텐츠의 정확성과 다양성에 영향을 줄 수 있습니다. 그러나 Tencent의 새로운 접근 방식은 첫 번째 추상 텍스트와 두 번째 초록 텍스트의 두 가지 정보 소스를 소개합니다. 이 두 가지 추상 텍스트의 정보의 양은 다르며 첫 번째 추상 텍스트에는 정확하고 잘못된 진술이 포함되어있어 비교 학습의 기초가됩니다.

이 대비 학습 방법을 사용하면 모델이 동일한 텍스트의 다른 초록에서 첫 번째 추상 텍스트에서 학습 할 수 있으므로 단일 요약으로 인한 학습 오류를 효과적으로 방해합니다. 이 혁신적인 방법은 모델의 일반화 능력을 향상시킬뿐만 아니라 알려지지 않은 데이터에 직면 할 때 더 나은 성능을 발휘할 수있을뿐만 아니라 모델의 정확도를 향상시키고 잘못된 컨텐츠를 생성 할 확률을 줄입니다.

인공 지능 기술의 지속적인 발전으로 대형 언어 모델의 응용 범위가 점점 더 광범위 해졌으며 자연어 처리와 같은 분야에서는 컨텐츠 생성에 대한 지능적인 고객 서비스에 대한 큰 잠재력이 나타났습니다. Tencent의 특허 발표는 대형 언어 모델 교육 분야에서 또 다른 기술 혁신을 표시하며 향후 관련 연구 및 응용 프로그램을위한 새로운 방향을 제공 할 것으로 예상됩니다.

이 기술의 추가 개발은 지능형 응용 분야의 지속적인 발전을 촉진하고 모든 생계가 디지털 변환에서 인공 지능으로 가져온 편의를 더 잘 활용할 수 있도록 도와 줄 수 있습니다.

요컨대, 인공 지능 기술의 발전은 기존 응용 프로그램의 효과를 향상시킬뿐만 아니라 미래 개발을위한 탄탄한 토대를 임명합니다.