Tencent kündigte heute die Open Source seines großen Sprachmodells namens Hunyuan-Large mit einer Parameterskala von 398B und einem 52B-Aktivierungsparametervolumen an. Das Modell funktioniert in mehreren maßgeblichen Benchmarks gut und übertrifft ähnliche Open -Source -Modelle wie Lama 3.1 und Mixtral. Zu den technologischen Innovationen gehören die Anwendung hochwertiger synthetischer Daten, die das Problem unzureichender natürlicher Daten effektiv löst und Textsequenzen bis zu 256K unterstützt, wodurch die Funktionen der langen Textverarbeitung erheblich verbessert werden. Darüber hinaus hat Tencent den Bewertungsdatensatz mit dem Namen "Penguin Scroll" eröffnet, um den Mangel an hochwertigen langen Textbewertungssätzen in der Branche auszugleichen und die Entwicklung der großen Modelltechnologie zu fördern.
Tencent veröffentlichte heute das Open Source Moe Großsprachenmodell Hunyuan-Large mit einem Gesamtparametervolumen von 398b und einem Aktivierungsparametervolumen von 52b. Die Ergebnisse der öffentlichen Bewertung zeigen, dass Tencent Hunyuan groß in CMMLU, MMLU, CEVA1, Math als Lama3.1 und Mixtral.
Es wird davon ausgegangen, dass dieses Modell qualitativ hochwertige synthetische Daten in der technologischen Innovation erreichen und durch die Verwendung synthetischer Daten effektiv mit den Mängel natürlicher Daten umgehen kann. In Bezug auf die Kontextverarbeitungsfunktionen unterstützt das vorgebildete Modell Textsequenzen bis zu 256 K. und verbessert die Fähigkeit, lange Kontextaufgaben zu erledigen.
Gleichzeitig kündigte Tencent Hunyuan an, dass Tencent Hunyuan in Kürze Open Source Penguin Scroll Review -Set, um die Branchenangewandte Forschung zu unterstützen, um die Mängel von realen Long -Artikel -Überprüfungssätzen in der Branche zu füllen. Die selbstentwickelten Pinguin-Schriftrollen basieren auf einer Vielzahl natürlicher langer Texte wie öffentlicher Finanzierung, Recht und akademischer Arbeiten.
Die Veröffentlichung von Tencent Hunyuan großes großes Sprachmodell und die Open Source des Penguin -Scroll -Bewertungssatzes bietet der Branche leistungsfähigere Sprachmodelle und Bewertungswerkzeuge, um die Entwicklung der Verarbeitung natürlicher Sprache und künstlicher Intelligenz zu fördern.
Offizielle Website -Adresse: https://llm.hunyuan.tencent.com
Die Open Source of Hunyuan-Large und die gleichzeitige Freisetzung des Penguin Scroll Review haben einen weiteren großen Durchbruch für Tencent im Bereich großer Sprachmodelle gesetzt, der eine starke Unterstützung für akademische Forschung und industrielle Anwendungen bietet und sich auf ihre Zukunft freuen lohnt Entwicklung künstlicher Intelligenz.