aTrain هي أداة لنسخ تسجيلات الكلام تلقائيًا باستخدام أحدث نماذج التعلم الآلي دون تحميل أي بيانات. تم تطويره من قبل باحثين في مركز تحليلات الأعمال وعلوم البيانات بجامعة غراتس وتم اختباره من قبل باحثين من مركز المعرفة في غراتس.
أخبار كبيرة! تم نشر الورقة التي تقدم aTrain في مجلة التمويل السلوكي والتجريبي. من فضلك استشهد الآن بالمقالة المنشورة إذا كنت تستخدم aTrain لبحثك: خذ aTrain. تقديم واجهة لنسخ المقابلات بشكل يسهل الوصول إليه.
يمكن لمستخدمي Windows (10 و11) تثبيت aTrain عبر متجر تطبيقات Microsoft (رابط) أو عن طريق تنزيل برنامج التثبيت من موقع BANDAS-Center الإلكتروني (رابط).
بالنسبة لنظام التشغيل Linux، اتبع التعليمات الموجودة في Wiki الخاص بنا.
يمكن العثور على فيديو التثبيت والعرض التوضيحي هنا.
يقدم aTrain المزايا التالية:
سريع ودقيق
يوفر aTrain وصولاً سهل الاستخدام إلى تنفيذ Whisper الأسرع لنموذج OpenAI's Whisper، مما يضمن أفضل جودة نسخ في فئتها (انظر Wollin-Geiring et al. 2023) مقترنة بسرعات أعلى على جهاز الكمبيوتر المحلي الخاص بك. لا يستغرق النسخ عند اختيار الطراز الأعلى جودة سوى حوالي ثلاثة أضعاف طول الصوت الموجود في وحدات المعالجة المركزية المحمولة الحالية الموجودة عادةً في أجهزة الكمبيوتر المحمولة المخصصة للأعمال من الطبقة المتوسطة (على سبيل المثال، Core i5 12th Gen، وRyzen Series 6000).
كشف المتحدث
يحتوي aTrain على وضع اكتشاف مكبر الصوت استنادًا إلى pyannote.audio ويمكنه تحليل كل مقطع نصي لتحديد المتحدث الذي ينتمي إليه.
الحفاظ على الخصوصية والامتثال للقانون العام لحماية البيانات
يقوم aTrain بمعالجة تسجيلات الكلام المقدمة بشكل كامل دون اتصال بالإنترنت على جهازك الخاص ولا يرسل تسجيلات أو نسخًا إلى الإنترنت. يساعد ذلك الباحثين في الحفاظ على متطلبات خصوصية البيانات الناشئة عن الإرشادات الأخلاقية أو الامتثال للمتطلبات القانونية مثل السياسة العامة لحماية البيانات (GDRP).
دعم متعدد اللغات؟
يستطيع aTrain معالجة تسجيلات الكلام بأي من اللغات الـ 57 التالية: الأفريكانية، العربية، الأرمنية، الأذربيجانية، البيلاروسية، البوسنية، البلغارية، الكاتالونية، الصينية، الكرواتية، التشيكية، الدانمركية، الهولندية، الإنجليزية، الإستونية، الفنلندية، الفرنسية، الجاليكية، الألمانية ، اليونانية، العبرية، الهندية، المجرية، الآيسلندية، الإندونيسية، الإيطالية، اليابانية، الكانادا، الكازاخستانية، الكورية، اللاتفية، الليتوانية، المقدونية، الملايو، المهاراتية، الماوري، النيبالية، النرويجية، الفارسية، البولندية، البرتغالية، الرومانية، الروسية، الصربية، السلوفاكية، السلوفينية، الإسبانية، السواحيلية، السويدية، التاغالوغية، التاميلية، التايلاندية، التركية، الأوكرانية، الأردية، الفيتنامية، والويلزية.
مخرجات متوافقة مع MAXQDA وATLAS.ti وNVivo؟
يوفر aTrain ملفات النسخ التي يمكن استيرادها بسهولة إلى الأدوات الأكثر شيوعًا للتحليل النوعي، مثل ATLAS.ti وMAXQDA وNVivo. يتيح لك هذا تشغيل الصوت مباشرة لجزء النص المقابل من خلال النقر على الطابع الزمني الخاص به. اذهب إلى البرنامج التعليمي.
دعم نفيديا GPU
يمكن تشغيل aTrain إما على وحدة المعالجة المركزية أو وحدة معالجة الرسومات NVIDIA (يتطلب تثبيت مجموعة أدوات CUDA). تعمل وحدة معالجة الرسومات NVIDIA التي تدعم CUDA على تحسين سرعة النسخ واكتشاف السماعات بشكل كبير، مما يقلل وقت النسخ إلى 20% من طول الصوت على أجهزة الكمبيوتر المحمولة المخصصة للألعاب ذات المستوى المبتدئ.
لقطة الشاشة 1 | لقطة الشاشة 2 |
---|---|
لاختبار وقت معالجة aTrain-core، قمنا بنسخ محادثة بين كريستين لاجارد وأندريا إنريا في المنتدى الخامس للبنك المركزي الأوروبي حول الإشراف المصرفي 2023 والتي نشرها البنك المركزي الأوروبي على YouTube بموجب ترخيص المشاع الإبداعي، وتم تنزيلها كملف فيديو MP4 بدقة 320 بكسل. تبلغ مدة الملف 22 دقيقة بالضبط وتم نسخه على أجهزة حاسوبية مختلفة مع تمكين اكتشاف السماعات. يوضح الشكل أدناه وقت المعالجة لكل نسخة.
وقت النسخ للملف 00:22:00:
جهاز الحوسبة | كبير-v3 | تقطير كبير-v3 |
---|---|---|
وحدة المعالجة المركزية: رايزن 6850U | 00:33:02 | 00:13:30 |
وحدة المعالجة المركزية: أبل M1 | 00:33:15 | 00:21:40 |
وحدة المعالجة المركزية: إنتل i9-10940X | 00:10:25 | 00:04:36 |
وحدة معالجة الرسوميات: RTX 2080 Ti | 00:01:44 | 00:01:06 |
ويدعم ويندوز بشكل كامل.
دعم دبيان مع تعليمات ويكي التثبيت اليدوي
لا يوجد دعم لنظام التشغيل MacOS حاليًا.
إذا كنت تريد استخدام Windows Server، فتأكد من تثبيت WebView2:
https://developer.microsoft.com/en-us/microsoft-edge/webview2/#download
ما عليك سوى الوصول إلى برنامج التثبيت من متجر تطبيقات Microsoft
https://apps.microsoft.com/store/detail/atrain/9N15Q44SZNS2
يجب أن يكون لديك بيثون>=3.10
إذا كنت بحاجة إلى مساعدة في تثبيت ذلك، فاطلع على هذه الموارد:
https://www.python.org/downloads/release/python-31011/
إعداد بيئة افتراضية
python -m venv venv
تفعيل البيئة الافتراضية
.venvScriptsactivate
قم بتثبيت القطار
pip install aTrain@git+https://github.com/JuergenFleiss/aTrain.git --extra-index-url https://download.pytorch.org/whl/cu118
قم بتنزيل ffmpeg وجميع النماذج المطلوبة من Whisper وpyannote.audio باستخدام برنامج نصي لوحدة التحكم. ملاحظة: يحتوي إصدار المستخدم في متجر Microsoft على هذه الأصول المضمنة بالفعل.
aTrain init
قم بتشغيل التطبيق باستخدام البرنامج النصي لوحدة التحكم
aTrain start
نحن نستخدم pyinstaller لتجميد كود aTrain وإنشاء ملف قابل للتنفيذ مستقل.
إذا كنت تريد إنشاء حزمة التعليمات البرمجية الخاصة بك، فاتبع الخطوات التالية:
استنساخ وتثبيت aTrain في وضع قابل للتحرير
git clone https://github.com/JuergenFleiss/aTrain.git
cd aTrain
pip install -e . --extra-index-url https://download.pytorch.org/whl/cu118
قم بتنزيل ffmpeg وجميع النماذج المطلوبة من Whisper وpyannote.audio باستخدام برنامج نصي لوحدة التحكم
aTrain init
قم بتثبيت برنامج pyinstaller
pip install pyinstaller
أنشئ الملف القابل للتنفيذ باستخدام التعليمات المتوفرة في الملف "build.spec"
pyinstaller build.spec
تهانينا! لقد قمت للتو ببناء ملف مستقل قابل للتنفيذ لـ aTrain.
لفتح هذا الإصدار من aTrain، ما عليك سوى الانتقال إلى مجلد الإخراج (./dist/aTrain) وفتح الملف القابل للتنفيذ (على سبيل المثال، aTrain.exe لنظام التشغيل Windows).
إذا كنت تريد المضي قدمًا وإنشاء برنامج تثبيت MSIX لـ aTrain، فيمكنك استخدام Advanced Installer Express.
للحصول على معلومات حول كيفية استخدام Advanced Installer Express، راجع الوثائق الخاصة بهم.
صور GIF والأيقونات الموجودة في aTrain هي من التينور والأيقونات المسطحة.