第7回Sound Expoが開幕、AIアプリケーションを続々リリース
著者:Eve Cole
更新時間:2024-11-16 18:24:02
10月24日、第7回ワールドサウンドエキスポと2024年iFlytekグローバル1024開発者フェスティバルが合肥で開幕し、iFlytek会長のLiu Qingfeng氏はiFlytek Spark大型モデルアプリケーションレポートカードを発表し、人々の生活を強化するiFlytek Spark 4.0 Turboおよび関連アプリケーションと製品をリリースした。 。同日、iFlytek、ファーウェイ、合肥ビッグデータ資産運用有限公司が共同構築した国内超大規模インテリジェントコンピューティングプラットフォーム「飛興2」が正式にスタートした。 Liu Qingfeng氏は、三者共同チームが過去1年間に多くの「困難な病気」を克服し、500以上の基本的なソフトウェアとハードウェアの問題、モデル適応の問題を解決したと紹介し、将来的には「飛興2」は新しいモデルと新しいものをもたらすでしょう。インテリジェント コンピューティング クラスターの継続的な適応と規模の開発。現場では、iFlytek が作成した超擬人化デジタル ヒューマンがデビューし、音声、ビデオ、画像、テキストのマルチモーダル インタラクションを実現し、ユーザーがバックグラウンドでの簡単な編集と定義で独自のパーソナライズされたデジタル ヒューマンを作成できるようにサポートしました。独自の漫画画像をすばやく生成できます。音声認識の分野では、iFlytek の遠方界の高ノイズシーンの音声認識技術がその利点をさらに拡大したことは注目に値します。多言語機能に関しては、全国の県レベルの都市で200以上の方言を完全にカバーすることを初めて達成し、Spark多言語大規模モデルをリリースしました。初めて、中国語と英語に加えて、ロシア語、日本語、アラビア語、フランス語などの 8 言語をサポートできます。現場では、ファーウェイとiFlytekが共同で、強力なリアルタイム音声処理機能を使用する革新的なテクノロジーであるサウンド修復機能を発表しました。ユーザーが単語を発音すると、その音声がリアルタイムで分析され、修復および最適化されて、発音の明瞭さと明瞭さが向上し、言語障害を持つユーザーがよりスムーズなコミュニケーションを実現できるようになります。