aTrain 是利用最先進的機器學習模型自動轉錄語音錄音的工具,無需上傳任何資料。它由格拉茨大學商業分析和數據科學中心的研究人員開發,並由格拉茨知識中心的研究人員進行測試。
大新聞!介紹aTrain的論文已發表在《行為與實驗金融學雜誌》。如果您使用 aTrain 進行研究,現在引用已發表的論文:乘坐 aTrain。引入用於無障礙轉錄訪談的介面。
Windows(10 和 11)使用者可以透過 Microsoft 應用程式商店(連結)或從 BANDAS-Center 網站(連結)下載安裝程式來安裝 aTrain。
對於 Linux,請按照我們的 Wiki 中的說明進行操作。
您可以在此處找到安裝和演示影片。
aTrain 有以下優勢:
快速且準確
aTrain 提供了一種用戶友好的方式來訪問 OpenAI 的 Whisper 模型的更快的 Whisper 實現,確保一流的轉錄質量(參見 Wollin-Geiring 等人,2023),並在本地計算機上實現更高的速度。選擇最高品質型號時的轉錄僅需中級商務筆記型電腦(例如第 12 代酷睿 i5、銳龍系列 6000)中常見的當前行動 CPU 音訊長度的三倍左右。
說話者檢測
aTrain 有一個基於 pyannote.audio 的說話者偵測模式,可以分析每個文字片段以確定它屬於哪個說話者。
隱私保護和 GDPR 合規性
aTrain 在您自己的裝置上完全離線處理所提供的語音錄音,並且不會將錄音或轉錄發送到網路。這有助於研究人員維護道德準則所產生的資料隱私要求或遵守 GDPR 等法律要求。
多語言支援 ?
aTrain 可以處理以下57 種語言中任意一種的語音錄音:南非荷蘭語、阿拉伯語、亞美尼亞語、亞塞拜然語、白俄羅斯語、波士尼亞語、保加利亞語、加泰隆尼亞語、中文、克羅埃西亞語、捷克語、丹麥語、荷蘭語、英語、愛沙尼亞語、芬蘭語、法語、加利西亞語、德語, 希臘語, 希伯來語, 印地語, 匈牙利語, 冰島語, 印尼語, 意大利語, 日語, 卡納達語, 哈薩克語, 韓語, 拉脫維亞語, 立陶宛語, 馬其頓語, 馬來語, 馬拉地語, 毛利語, 尼泊爾語, 挪威語, 波斯語, 波蘭語, 葡萄牙語, 羅馬尼亞語,俄語, 塞爾維亞語、斯洛伐克語、斯洛維尼亞語、西班牙語、斯瓦希里語、瑞典語、他加祿語、泰米爾語、泰語、土耳其語、烏克蘭語、烏爾都語、越南語和威爾斯語。
MAXQDA、ATLAS.ti 和 NVivo 相容輸出 ?
aTrain 提供的轉錄檔案可無縫匯入最受歡迎的質性分析工具 ATLAS.ti、MAXQDA 和 NVivo。這允許您透過點擊時間戳來直接播放相應文字段的音訊。轉到教程。
Nvidia GPU 支援
aTrain 可以在 CPU 或 NVIDIA GPU 上運作(需要安裝 CUDA 工具包)。支援 CUDA 的 NVIDIA GPU 顯著提高了轉錄和說話者檢測的速度,將目前入門級遊戲筆記型電腦上的轉錄時間縮短至音訊長度的 20%。
截圖1 | 截圖2 |
---|---|
為了測試aTrain-core 的處理時間,我們轉錄了Christine Lagarde 和Andrea Enria 在2023 年第五屆歐洲央行銀行監管論壇上的對話,該對話由歐洲中央銀行根據知識共享許可在YouTube 上發布,下載為320p MP4 影片檔。該文件的持續時間恰好為 22 分鐘,並在啟用了說話者檢測的不同計算設備上轉錄。下圖顯示了每個轉錄的處理時間。
00:22:00 檔案的轉錄時間:
計算設備 | 大v3 | 蒸餾大-v3 |
---|---|---|
CPU:銳龍6850U | 00:33:02 | 00:13:30 |
CPU:蘋果M1 | 00:33:15 | 00:21:40 |
CPU:英特爾 i9-10940X | 00:10:25 | 00:04:36 |
顯示卡:RTX 2080 Ti | 00:01:44 | 00:01:06 |
完全支援 Windows。
Debian 支援以及手動安裝 Wiki 說明
目前不支援 MacOS。
如果您想使用 Windows Server,請確保安裝了 WebView2:
https://developer.microsoft.com/en-us/microsoft-edge/webview2/#download
只需從 Microsoft 應用程式商店存取安裝程式即可
https://apps.microsoft.com/store/detail/atrain/9N15Q44SZNS2
你需要 python >=3.10
如果您需要安裝協助,請查看以下資源:
https://www.python.org/downloads/release/python-31011/
設定虛擬環境
python -m venv venv
啟動虛擬環境
.venvScriptsactivate
安裝火車
pip install aTrain@git+https://github.com/JuergenFleiss/aTrain.git --extra-index-url https://download.pytorch.org/whl/cu118
使用控制台腳本從 Whisper 和 pyannote.audio 下載 ffmpeg 和所有必要的模型 注意:Microsoft 商店中的使用者版本已包含這些資源。
aTrain init
使用控制台腳本運行應用程式
aTrain start
我們使用 pyinstaller 凍結 aTrain 的程式碼並建立一個獨立的可執行檔。
如果您想建立自己的程式碼包,請按照以下步驟操作:
以可編輯模式複製並安裝 aTrain
git clone https://github.com/JuergenFleiss/aTrain.git
cd aTrain
pip install -e . --extra-index-url https://download.pytorch.org/whl/cu118
使用控制台腳本從 Whisper 和 pyannote.audio 下載 ffmpeg 和所有必需的模型
aTrain init
安裝pyinstaller
pip install pyinstaller
使用檔案“build.spec”中提供的指令建立可執行檔
pyinstaller build.spec
恭喜!您剛剛為 aTrain 建立了一個獨立的可執行檔。
要開啟此版本的 aTrain,只需前往輸出資料夾 (./dist/aTrain) 並開啟可執行檔(例如 Windows 的 aTrain.exe)。
如果您想更進一步並為 aTrain 建立 MSIX 安裝程序,可以使用 Advanced Installer Express。
有關如何使用 Advanced Installer Express 的信息,請參閱其文件。
aTrain 中的 GIF 和圖示來自 tenor 和 flaticon。