fstalign
เป็นเครื่องมือในการสร้างการจัดตำแหน่งระหว่างสองลำดับของโทเค็น (ที่นี่เรียกว่า "การอ้างอิง" และ "สมมติฐาน") มันมีฟังก์ชั่นหลักสองประการ: การคำนวณอัตราความผิดพลาดของคำ (WER) และจัดตำแหน่งการอ้างอิงแบบฟอร์ม NLP กับสมมติฐาน CTM
เนื่องจากการใช้อัลกอริทึม OpenFST และ LAZY สำหรับการจัดตำแหน่งแบบข้อความ fstalign
จึงมีประสิทธิภาพสำหรับการคำนวณ WER ในขณะที่ยังให้ความยืดหยุ่นที่สำคัญสำหรับคุณสมบัติการวัดที่แตกต่างกันและการวิเคราะห์ข้อผิดพลาด
เราใช้ git submodules เพื่อจัดการการพึ่งพาของบุคคลที่สาม Initialize and update submodules before proceeding to the main build steps.
git submodule update --init --recursive
This will pull the current dependencies:
นอกจากนี้เรายังมีการพึ่งพานอกเขตย่อยของบุคคลที่สาม:
-DOPENFST_ROOT
กรอบการสร้างปัจจุบันคือ cmake ติดตั้ง cmake ตามคำแนะนำที่นี่ (https://cmake.org/install/)
เพื่อสร้าง fstalign ให้วิ่ง:
mkdir build && cd build
cmake .. -DOPENFST_ROOT="<path to OpenFST>" -DDYNAMIC_OPENFST=ON
make
หมายเหตุ: -DDYNAMIC_OPENFST=ON
เป็นสิ่งจำเป็นหาก OpenFST ที่ OPENFST_ROOT
รวบรวมเป็นไลบรารีที่ใช้ร่วมกัน Otherwise static libraries are assumed.
ในที่สุดการทดสอบสามารถเรียกใช้โดยใช้:
make test
The fstalign docker image is hosted on Docker Hub and can be easily pulled and run:
docker pull revdotcom/fstalign
docker run --rm -it revdotcom/fstalign
ดู https://hub.docker.com/r/revdotcom/fstalign/tags สำหรับรุ่น/แท็กที่มีอยู่ที่จะดึง หากคุณต้องการเรียกใช้เครื่องมือในไฟล์ท้องถิ่นคุณสามารถติดตั้งไดเรกทอรีท้องถิ่นด้วยธง -v
ของคำสั่ง docker run
จากภายในภาชนะ:
/fstalign/build/fstalign --help
สำหรับการพัฒนาคุณยังสามารถสร้างภาพนักเทียบท่าในเครื่องโดยใช้:
docker build . -t fstalign-dev
สำหรับข้อมูลเพิ่มเติมเกี่ยวกับวิธีการใช้ fstalign
โปรดดูเอกสารของเราสำหรับรายละเอียดเพิ่มเติม