fstalign
は、2つのトークンのシーケンス間にアラインメントを作成するためのツールです(ここでは、「参照」および「仮説」と呼ばれます)。 2つの重要な機能があります。ワードエラー率(WER)の計算と、CTM仮説を備えたNLP形式の参照を調整します。
テキストベースのアラインメントのためにOpenFSTおよびLazyアルゴリズムを使用しているため、 fstalign
WERの計算に効率的であり、さまざまな測定機能とエラー分析に大きな柔軟性を提供します。
Gitサブモジュールを使用して、サードパーティの依存関係を管理します。メインビルドステップに進む前に、サブモジュールを初期化および更新します。
git submodule update --init --recursive
これにより、現在の依存関係がプルされます。
さらに、サードパーティのサブモジュール以外に依存関係があります。
-DOPENFST_ROOT
経由のCMAKEコマンド中に設定することにより、ビルドシステムに現在提供されています。現在のビルドフレームワークはcmakeです。 cmakeをインストールしてください。ここで説明書(https://cmake.org/install/)。
fstalignを構築するには、実行してください。
mkdir build && cd build
cmake .. -DOPENFST_ROOT="<path to OpenFST>" -DDYNAMIC_OPENFST=ON
make
注: -DDYNAMIC_OPENFST=ON
OPENFST_ROOT
のopenfstが共有ライブラリとしてコンパイルされている場合は、onが必要です。それ以外の場合は、静的ライブラリが想定されています。
最後に、以下を使用してテストを実行できます。
make test
fstalign docker画像はDockerハブでホストされており、簡単に引っ張って実行できます。
docker pull revdotcom/fstalign
docker run --rm -it revdotcom/fstalign
利用可能なバージョン/タグについては、https://hub.docker.com/r/revdotcom/fstalign/tagsを参照してください。ローカルファイルでツールを実行したい場合は、 docker run
コマンドの-v
フラグを使用してローカルディレクトリをマウントできます。
コンテナ内から:
/fstalign/build/fstalign --help
開発については、以下を使用してDocker画像をローカルに構築することもできます。
docker build . -t fstalign-dev
fstalign
の使用方法の詳細については、詳細についてはドキュメントを参照してください。