Step-1o Audio の 1,000 億パラメータを備えたエンドツーエンド音声モデルはオンラインであり、Yuewen アプリに接続されます

著者：Eve Cole 更新時間：2024-12-16 13:32:01

Step Star は最近、1,000 億のパラメータを備えた中国初のエンドツーエンド音声モデルである Step-1o を発表し、国内の音声技術の分野で大きな進歩を遂げました。 Step-1o は、音声理解と生成の完璧な統合を達成するだけでなく、モデルの感情指数と IQ 上限を画期的に向上させ、ユーザーに超自然的で高品質な音声インタラクションエクスペリエンスをもたらします。音声とテキストの混合入出力をサポートし、迅速な応答がいつでも中断できるため、対話の利便性が大幅に向上します。

Step-1o モデルは、音声やテキストなどの混合入出力をサポートし、迅速な応答がいつでも中断でき、便利なインタラクティブエクスペリエンスを提供します。また、音色、リズム、方言、個人的な口頭表現習慣などの音声の特徴を深く理解して模倣することができ、本物の人間と同じくらい柔軟で感情豊かな表現効果をもたらします。さらに、Step-1o は、自己学習と模倣によって応答の質を継続的に向上させる「スマート」な音声モデルでもあり、豊富な知識を備えており、感情的価値の高い専門的なアドバイスや親睦を提供できます。

微信截图_20241216081425.png

Step-1o 音声モデルの 3 つの主な特徴は次のとおりです。オンライン感情知能。複雑な人間のセマンティクスや音声のイントネーションの背後にある感情情報を理解し、社会倫理やルールを深く理解しています。オンライン IQ は、質問に答えることができます。さまざまな専門分野で質が高く、批判的思考能力が高く、理解し、模倣し、創造する能力があり、音声表現の詳細を正確に把握し、リアルタイムで奇妙な音声ストーリーを作成して伝えることができます。

Step-1o には幅広いアプリケーションがあり、ニュース放送、チャットコンパニオン、オーディオブック、オンライン教育、スマートハードウェア、自動車、その他の業界における音声インタラクションテクノロジのニーズをサポートできます。

近い将来、Step-1o は Yuewen アプリに接続され、リアルタイムの音声通話サービスが提供される予定です。その際、ユーザーは電話で Step-1o と通信し、患者の話を聞き、アドバイスするサービスを楽しむことができます。この新機能のリリースにより、Step-1o のアプリケーションシナリオがさらに拡張され、より豊かな音声対話エクスペリエンスがユーザーに提供されます。

Step-1o の登場は、ユーザーに、より便利でインテリジェントな音声インタラクション体験をもたらすだけでなく、音声人工知能技術がより人間的でインテリジェントな方向に発展していることを示しており、将来のアプリケーションの展望に期待する価値があります。その強力な機能と幅広い応用シナリオは、さまざまな業界に大きな影響を与えるでしょう。