Der Herausgeber von Downcodes erfuhr, dass auf der Hugging Face-Plattform ein 7-Milliarden-Parameter-Sprachmodell namens Teuken-7B veröffentlicht wurde, das alle 24 EU-Amtssprachen unterstützt. Das Modell wurde vom EU-Forschungsprojekt OpenGPT-X entwickelt und steht Nutzern als Open Source zur Verfügung. Im Gegensatz zu den meisten auf Englisch ausgerichteten KI-Sprachmodellen wurde Teuken-7B von Grund auf neu entwickelt, wobei etwa die Hälfte seiner Trainingsdaten aus nicht-englischen europäischen Sprachen stammte, was ihm einen erheblichen Vorteil bei der Handhabung mehrerer europäischer Sprachen verschaffte.
Teuken-7B, ein Sprachmodell mit 7 Milliarden Parametern, ist jetzt auf Hugging Face verfügbar und unterstützt alle 24 offiziellen EU-Sprachen. Das Modell wurde vom EU-Forschungsprojekt OpenGPT-X entwickelt und steht Nutzern als Open-Source-Projekt zur Verfügung. Im Gegensatz zu den meisten auf Englisch ausgerichteten KI-Sprachmodellen wurde Teuken-7B von Grund auf neu entwickelt, wobei etwa die Hälfte seiner Trainingsdaten aus nicht-englischen europäischen Sprachen stammte.
Hinweis zur Bildquelle: Das Bild wird von KI generiert und vom Dienstanbieter Midjourney autorisiert
Nach Angaben des Entwicklungsteams schneidet Teuken-7B in allen Sprachen, in denen es trainiert wurde, gut ab und seine Zuverlässigkeit ist besonders beeindruckend, wenn es um nicht-englische Sprachen geht. Um die Leistung von Sprachmodellen in europäischen Sprachen zu messen, erstellte das Projektteam außerdem ein neues europäisches LLM-Ranking, das frühere Standardtestmethoden übertrifft, die hauptsächlich auf Englisch basierten.
Diese Veröffentlichung stellt einen bedeutenden Fortschritt in Europas Bemühungen um mehrsprachige KI-Modelle dar und bietet Entwicklern gleichzeitig ein leistungsstarkes und vielfältiges Tool zur Unterstützung sprachübergreifender Anwendungen und Forschung.
Die Open-Source-Veröffentlichung von Teuken-7B eröffnet neue Möglichkeiten im Bereich der mehrsprachigen KI und spiegelt Europas aktive Bemühungen in der unabhängigen Forschung und Entwicklung der KI-Technologie wider. Seine hervorragenden mehrsprachigen Verarbeitungsfähigkeiten werden globalen Entwicklern mehr Komfort bieten und die energische Entwicklung sprachübergreifender Anwendungen fördern. Es wird erwartet, dass Teuken-7B in Zukunft in weiteren Bereichen eine Rolle spielen kann.