fstalign
1.14.0
fstalign
是在两个令牌序列之间建立对齐的工具(在这里称为“参考”和“假设”)。它具有两个关键功能:计算单词错误率(WER)和与CTM假设对齐NLP形式的参考。
由于使用OpenFST和懒惰算法进行基于文本的对齐方式, fstalign
有效地计算WER,同时还为不同的测量功能和错误分析提供了显着的灵活性。
我们使用git子模型管理第三方依赖性。在进行主要构建步骤之前,初始化和更新子模型。
git submodule update --init --recursive
这将吸引当前的依赖性:
此外,我们在第三方子模型之外还具有依赖性:
-DOPENFST_ROOT
在CMAKE命令期间提供给构建系统。当前的构建框架是CMAKE。按照此处的说明安装CMAKE(https://cmake.org/install/)。
要构建fstalign,请运行:
mkdir build && cd build
cmake .. -DOPENFST_ROOT="<path to OpenFST>" -DDYNAMIC_OPENFST=ON
make
注意:如果OPENFST_ROOT
在共享库中编译为OpenFST,则需要-DDYNAMIC_OPENFST=ON
。否则假定静态库。
最后,可以使用:
make test
Fstalign Docker映像托管在Docker Hub上,可以轻松拉出并运行:
docker pull revdotcom/fstalign
docker run --rm -it revdotcom/fstalign
请参阅https://hub.docker.com/r/revdotcom/fstalign/tags,以获取可用版本/标签。如果您想在本地文件上运行该工具,则可以使用docker run
命令的-v
标志安装本地目录。
从容器内部:
/fstalign/build/fstalign --help
对于开发,您还可以使用以下方式在本地构建Docker映像。
docker build . -t fstalign-dev
有关如何使用fstalign
的更多信息,请参阅我们的文档以获取更多详细信息。