Öffne deinen Mund und knie nieder! Fish Audio veröffentlicht Fish Speech 1.5, fügt fünf neue Sprachen hinzu und wird außerdem eine nahtlose Echtzeit-Konversationsfunktion einführen

Autor：Eve Cole Aktualisierungszeit：2024-12-18 10:00:02

Das neu veröffentlichte Sprachsynthesemodell Fish Speech 1.5 von Fish Audio hat einen Sturm auf dem Gebiet der Sprachsynthese ausgelöst. Dieses Modell hat nicht nur erhebliche Verbesserungen in Bezug auf Genauigkeit, Stabilität und sprachübergreifende Fähigkeiten erzielt, sondern was noch beeindruckender ist, ist, dass es fünf neue Sprachen unterstützt und in Kürze eine nahtlose Echtzeit-Konversationsfunktion einführen wird, die beispiellose Vorteile bringt Vorteile für Benutzer. Seine starke Leistung basiert auf mehr als 1 Million Stunden mehrsprachiger Trainingsdaten und es hat den zweiten Platz im anonymen TTS-Arena-Ranking erreicht. Seine Stärke ist nicht zu unterschätzen. In diesem Artikel werden die Funktionen und Vorteile von Fish Speech 1.5 ausführlich erläutert.

Fish Audio hat kürzlich einen Blockbuster herausgebracht – Fish Speech 1.5. Dieses neue Sprachsynthesemodell ist einfach „klangvoll“ und übertrifft seine Vorgänger nicht nur in Bezug auf Genauigkeit, Stabilität und sprachübergreifende Fähigkeiten. Darüber hinaus wird Fish Audio bald ein echtes Produkt auf den Markt bringen Zeitnahe nahtlose Konversationsfunktion, die es Benutzern ermöglicht, jederzeit und überall eine Sprachbibliothek für interaktiven Chat auszuwählen.

Das „Wissen“ von Fish Speech1.5 ist ziemlich tiefgreifend. Es hat mehr als 1 Million Stunden an mehrsprachigen Trainingsdaten „genagt“, um seine einzigartigen Fähigkeiten zu entwickeln. Derzeit beherrscht es 13 Sprachen, darunter Englisch, Chinesisch und Japanisch . Das ist keine Prahlerei, ich habe im anonymen TTS-Arena-Ranking den zweiten Platz belegt!

Die Sprachklonierungsfunktion von Fish Speech1.5 kann auch als „Flash“ bezeichnet werden. Die Verzögerungszeit beträgt weniger als 150 Millisekunden und sie wird in Echtzeit generiert. Noch wichtiger ist, dass Fish Speech1.5 auch das vorab trainierte Modell großzügig als Open Source bereitstellt. Egal, ob Sie sich zu Hause „tunen“ möchten oder sich für einen Cloud-Dienst entscheiden, Sie können es ganz einfach tun!

Hauptmerkmale:

Sprachsynthese ohne und mit wenigen Samples: Sie müssen nur 10 bis 30 Sekunden lang Klangbeispiele anhören, und das Gerät kann diese perfekt nachahmen und eine hochwertige Sprachsyntheseausgabe erzeugen. Es ist wie eine Super-Imitationsshow. Solange man es wagt zu „zeigen“, wagt es zu „lernen“!

Mehrsprachige und sprachübergreifende Unterstützung: Sind Sie immer noch besorgt über Sprachbarrieren? Fish Speech 1.5 hat Ihnen bereits dabei geholfen, die Hindernisse zu überwinden. Kopieren Sie einfach, was Sie sagen möchten, und fügen Sie es ganz einfach ein! Derzeit werden Englisch, Japanisch, Koreanisch, Chinesisch, Französisch, Deutsch, Arabisch und Spanisch unterstützt. Jetzt können Sie endlich mit Freunden aus der ganzen Welt chatten!

Keine Phonemabhängigkeit: Herkömmliche Sprachsynthesemodelle basieren häufig auf Phonemen, aber Fish Speech 1.5 verfolgt einen anderen Ansatz. Es verfügt über hervorragende Verallgemeinerungsfähigkeiten und kann Text in jeder Sprachschrift verarbeiten. Dies ist einfach eine Revolution in der Welt der Sprachsynthese.

Sehr genau: Bei einem 5-minütigen englischen Artikel beträgt die Fehlerquote von Fish Speech1.5 nur 2 %, was eine ziemlich erstaunliche Zahl ist!

Schnell: Fish Speech1.5 ist auch sehr schnell. Auf einem Nvidia RTX4060-Laptop beträgt der Echtzeitkoeffizient etwa 1:5, während er auf einem Nvidia RTX4090 sogar 1:15 beträgt „fliegendes“ Gefühl!

Fish Speech1.5 unterstützt auch die lokale Bereitstellung:

WebUI: Es bietet eine einfache und benutzerfreundliche Web-Benutzeroberfläche, die mit gängigen Browsern wie Chrome, Firefox und Edge kompatibel ist und es Ihnen ermöglicht, jederzeit und überall den Spaß der Sprachsynthese zu erleben.

GUI: Es bietet auch eine grafische PyQt6-Schnittstelle, die nahtlos mit dem API-Server zusammenarbeiten kann und Linux-, Windows- und macOS-Systeme unterstützt. Das sind einfach gute Nachrichten für die „Drei Musketiere“!

Bereitstellungsfreundlich: Sie können Fish Speech1.5 auch problemlos auf Linux-, Windows- und MacOS-Systemen bereitstellen und so Geschwindigkeitsverluste minimieren.

Offizielle Website-Adresse: https://fish.audio/zh-CN/

Projektadresse: https://github.com/fishaudio/fish-speech

Alles in allem wird Fish Speech 1.5 mit seinen leistungsstarken Funktionen, praktischen Bereitstellungsmethoden und Open-Source-Vorteilen im Bereich der Sprachsynthese große Aufmerksamkeit erregen und Benutzern ein komfortableres und intelligenteres Sprachinteraktionserlebnis bieten. Seine Effizienz, Genauigkeit und mehrsprachige Unterstützung bieten leistungsstarken technischen Support für verschiedene Anwendungsszenarien. Weitere Informationen finden Sie auf der offiziellen Website und unter der Projektadresse.