Moore Threads hat kürzlich sein selbst entwickeltes groß angelegtes Audio-Verständnismodell MooER als Open-Source-Lösung bereitgestellt. Dabei handelt es sich um das erste groß angelegte Open-Source-Sprachmodell der Branche, das auf inländischen GPUs mit vollem Funktionsumfang für Training und Inferenz basiert. MooER hat das Training von 5.000 Stunden Audiodaten in nur 38 Stunden auf der intelligenten Computerplattform Moore Thread Kuae (KUAE) abgeschlossen und damit seine effizienten Trainingsfähigkeiten und hervorragenden Leistung unter Beweis gestellt. Das Modell unterstützt die chinesische und englische Spracherkennung sowie die phonetische Übersetzung Chinesisch-Englisch und hat in mehreren Testsätzen beeindruckende Ergebnisse erzielt. Im Covost2-Testsatz Chinesisch-Englisch erreichte es beispielsweise einen BLEU-Wert, der dem Industrieniveau nahe kommt. Der Schritt von Moore Thread wird die Entwicklung heimischer künstlicher Intelligenz stark unterstützen.
Das MooER-Großmodell hat den Inferenzcode und das Modell, das auf 5.000 Stunden Daten trainiert wurde, als Open Source bereitgestellt und plant, den Trainingscode und das Modell, das auf 80.000 Stunden Daten trainiert wurde, weiterhin als Open Source bereitzustellen. Das Modell hat eine klare Struktur und wird mit dem Open-Source-Sprachencoder Paraformer und dem großen Sprachmodell Qwen2-7B-instruct initialisiert. Auch im technischen Vergleich ist es anderen Open-Source-Modellen überlegen. Durch das Open-Source-Programm MooER bietet Moore Thread wertvolle Lern- und Übungsmöglichkeiten für Entwickler, denen es an Ressourcen mangelt, und fördert den Fortschritt und die Entwicklung der heimischen KI-Technologie. GitHub-Adresse: https://github.com/MooreThreads/MooER
Die Open Source von MooER spiegelt nicht nur die führende technische Stärke von MooER im Bereich der künstlichen Intelligenz wider, sondern zeigt auch seine Entschlossenheit und Verantwortung, den Technologieaustausch zu fördern und die Entwicklung des KI-Ökosystems voranzutreiben. Es lohnt sich, auf seine weitere Entwicklung und Anwendung zu blicken in der Zukunft.