Tencent beantragt ein Patent für "Big Language Model Training Method" zur Verbesserung der Modellverallgemeinerungsfähigkeit und -genauigkeit - KI -Artikel

Autor：Eve Cole Aktualisierungszeit：2025-02-14 17:16:01

Kürzlich beantragte Tencent Technology (Shenzhen) Co., Ltd. ein Patent namens "Trainingsmethoden, Geräte, Computergeräte und Speichermedien für große Sprachmodelle". Dieses Patent liefert lernbare Informationen für das Modell während des Trainings des großen Sprachmodells, indem der erste abstrakte Text und den zweiten abstrakten Text eingeführt wird.

Gemäß der Patentbeschreibung enthält der erste abstrakte Text und der zweite abstrakte Text unterschiedliche Informationsmengen, und der erste abstrakte Text enthält auch korrekte Anweisungen und falsche Aussagen. Durch Vergleich und Lernen dieser beiden verschiedenen Abstracts desselben Textes und der Unterscheidung der richtigen Aussagen und falschen Aussagen können wir die möglichen Probleme wie die Übereinstellung von Modellen und die ungenaue Erzeugung, die durch den einzelnen Zusammenfassungstext verursacht werden, effektiv vermeiden.

腾讯 (2)

Die Innovation dieser Methode besteht darin, dass sie die Generalisierungsleistung des Modells verbessert und die Genauigkeit des Modells effektiv verbessert. Durch die Einführung verschiedener abstrakter Textinhalte hat die Trainingsmethode von Tencent effizientere und genauere Verbesserungen des Trainingsprozesses von Großsprachenmodellen mitgebracht.

Dieser Fortschritt spiegelt nicht nur die technische Stärke von Tencent auf dem Gebiet der künstlichen Intelligenz wider, sondern bildet auch eine solide Grundlage für die Anwendung und Entwicklung großer Sprachmodelle in der Zukunft.