AI4Bharat の IndicConformers は、インドの 22 の公用語すべてで正確な音声からテキストへの変換を提供するために構築された ASR モデルのスイートです。最先端の深層学習技術を活用することで、これらのモデルは正確な文字起こしを提供します。 AI4Bharat Indic Conformer は、これほど膨大な言語をカバーする国内初のオープンソース ASR システムであり、テクノロジーをより包括的で誰もが利用できるようにする革新的なツールです。
モデルをロード、トレーニング、微調整、または再生するには、AI4Bharat NeMo をインストールする必要があります。以下に示すコマンドを使用してインストールすることをお勧めします。
git clone https://github.com/AI4Bharat/NeMo.git && cd NeMo && git checkout nemo-v2 && bash reinstall.sh
モデルは、Huggingface から、または以下のリンクを使用してダウンロードできます。
言語コード | モデル (ダウンロードリンク) |
---|---|
として | ダウンロード |
ブン | ダウンロード |
brx | ダウンロード |
土肥 | ダウンロード |
ぐ | ダウンロード |
こんにちは | ダウンロード |
知っている | ダウンロード |
コック | ダウンロード |
クス | ダウンロード |
まい | ダウンロード |
ミリリットル | ダウンロード |
ムニ | ダウンロード |
氏 | ダウンロード |
ね | ダウンロード |
または | ダウンロード |
パ | ダウンロード |
さ | ダウンロード |
座った | ダウンロード |
SD | ダウンロード |
た | ダウンロード |
て | ダウンロード |
あなた | ダウンロード |
Colab ノートブックもここで見つけることができます。
IndicConformer は MIT ライセンスに基づいてリリースされています。