Der Herausgeber von Downcodes erfuhr, dass Tencent heute das Open-Source-MOE-Großsprachenmodell Hunyuan-large mit einer Parametergröße von 398 B und einer Aktivierungsparametergröße von 52 B veröffentlicht hat. Dieses Modell hat in mehreren maßgeblichen Benchmark-Tests gute Ergebnisse erzielt und Llama3.1, Mixtral und andere erstklassige Open Source in neun Hauptdimensionen übertroffen, darunter CMMLU, MMLU, CEva1, MATH und andere multidisziplinäre umfassende Bewertungssätze sowie Chinesisch und englische NLP-Aufgaben, Code und Mathematik. Großes Modell, das leistungsstarke Leistung und breites Anwendungspotenzial zeigt. Die technologische Innovation von Hunyuan-large liegt in der Anwendung hochwertiger synthetischer Daten, die das Problem unzureichender natürlicher Daten wirksam löst und die Verarbeitung von Textsequenzen bis zu 256 KB unterstützt, wodurch die Verarbeitungsfähigkeiten langer Kontextaufgaben erheblich verbessert werden.
Es versteht sich, dass dieses Modell qualitativ hochwertige synthetische Daten im Hinblick auf technologische Innovationen erzielen kann. Durch die Verwendung synthetischer Daten zur Verbesserung des Trainings kann es die Mängel natürlicher Daten effektiv beheben. Was die Kontextverarbeitungsfähigkeiten anbelangt, unterstützt das vorab trainierte Modell Textsequenzen bis zu 256 KB, was die Fähigkeit, lange Kontextaufgaben zu bewältigen, erheblich verbessert.
Gleichzeitig kündigte Tencent Hunyuan an, dass Tencent Hunyuan, um den Mangel an echten Langtext-Rezensionssätzen in der Branche auszugleichen, den Penguin Scroll-Rezensionssatz als Open-Source-Quelle veröffentlichen wird, um die Branchenanwendungsforschung zu unterstützen. Das selbst entwickelte PenguinScrolls basiert auf einer Vielzahl natürlicher Langtexte wie öffentliche Finanzen, Rechtstexte und wissenschaftliche Arbeiten mit einem Längenbereich von 1K-128K und deckt verschiedene tiefgreifende Leseverständnis- und Langtext-Argumentationsaufgaben ab.
Die Veröffentlichung des Tencent Hunyuan Large-Sprachmodells und der Open Source des Penguin Scroll-Bewertungssatzes wird der Branche leistungsfähigere Sprachmodelle und Bewertungstools bieten und die Entwicklung der Verarbeitung natürlicher Sprache und künstlicher Intelligenz fördern.
Offizielle Website-Adresse: https://llm.hunyuan.tencent.com
Die Open Source des Hunyuan-Großmodells von Tencent bietet Entwicklern nicht nur leistungsstarke Tools, sondern trägt auch zum Fortschritt auf dem Gebiet der künstlichen Intelligenz bei. Die Open Source des Penguin Scroll-Rezensionssatzes wird die Verbesserung und Entwicklung der Langtextverarbeitungstechnologie weiter vorantreiben. Wir freuen uns auf weitere innovative Ergebnisse in der Zukunft!