( l يستمع | t hinks | s قمم )
مساعد مجاني ومحلي وغير متصل بالإنترنت بنسبة 100% مع وظائف التعرف على الكلام والرد.
يعمل ALTS في الخلفية وينتظر منك الضغط على cmd+esc
(أو win+esc
).
أثناء الضغط على مفتاح التشغيل السريع، سيتم تسجيل صوتك (يحفظ في جذر المشروع) .
عند الإصدار، يتوقف التسجيل ويتم إرسال النص إلى LLM (يتم حذف التسجيل) .
يتم بعد ذلك تجميع استجابات LLM وتشغيلها لك (كما هو موضح أيضًا كإشعارات سطح المكتب) .
يمكنك تعديل مجموعة مفاتيح التشغيل السريع والإعدادات الأخرى في config.yaml
الخاص بك.
جميع العمليات محلية ولا يغادر أي من تسجيلاتك أو استفساراتك بيئتك؛ يتم حذف التسجيلات بمجرد استخدامها؛ كل شيء خاص بشكل افتراضي
(تم اختباره على) الإصدار >=3.11 على نظام التشغيل macOS والإصدار >=3.8 على نظام التشغيل Windows
بشكل افتراضي، تم تكوين المشروع للعمل مع Ollama، وتشغيل نموذج stablelm2
(نموذج صغير جدًا وسريع). يجعل هذا الإعداد النظام بأكمله مجانيًا تمامًا للتشغيل محليًا ورائعًا للأجهزة منخفضة الموارد.
ومع ذلك، فإننا نستخدم LiteLLM لنكون مستقلين عن مقدمي الخدمات، بحيث يكون لديك الحرية الكاملة في انتقاء واختيار المجموعات الخاصة بك. قم بإلقاء نظرة على النماذج/المقدمين المدعومين للحصول على مزيد من التفاصيل حول تكوين LLM.
راجع
.env.template
وconfig-template.yaml
لتخصيص الإعداد الخاص بك
نحن نستخدم openAI's whisper
لتدوين استفساراتك الصوتية. إنه نموذج للتعرف على الكلام للأغراض العامة.
ستحتاج إلى تثبيت ffmepg
في بيئتك، ويمكنك تنزيله من الموقع الرسمي.
تأكد من مراجعة مستندات الإعداد الخاصة بهم لمعرفة أي متطلبات أخرى.
إذا تعثرت في بعض الأخطاء، فقد يكون أحد الأسباب هو عدم تنزيل النموذج تلقائيًا. إذا كان الأمر كذلك، فيمكنك تشغيل نموذج
whisper
في جهازك الطرفي (انظر الأمثلة) أو تنزيله يدويًا ووضع ملف النموذج في المجلد الصحيح
نحن نستخدم coqui-TTS
لـ ALTS للرد عليك. إنها مكتبة لتوليد تحويل النص إلى كلام المتقدم.
ستحتاج إلى تثبيت eSpeak-ng
في بيئتك:
تأكد من مراجعة مستندات الإعداد الخاصة بهم لمعرفة أي متطلبات أخرى.
إذا لم يكن لديك النموذج الذي تم تكوينه قد تم تنزيله بالفعل، فيجب تنزيله تلقائيًا أثناء بدء التشغيل، ومع ذلك، إذا واجهت أي مشكلات، فيمكن تنزيل النموذج الافتراضي مسبقًا عن طريق تشغيل ما يلي:
tts --text "this is a setup test" --out_path test_output.wav --model_name tts_models/en/vctk/vits --speaker_idx p364يحتوي النموذج الافتراضي على عدة "مكبرات صوت" للاختيار من بينها؛ سيؤدي تشغيل الأمر التالي إلى إنشاء موقع تجريبي حيث يمكنك اختبار الأصوات المختلفة المتاحة:
tts-server --model_name tts_models/en/vctk/vits
macOS – brew install espeak
لينكس – sudo apt-get install espeak -y
windows - قم بتنزيل الملف القابل للتنفيذ من الريبو الخاص بهم
على نظام التشغيل Windows، ستحتاج أيضًا إلى تطوير سطح المكتب باستخدام
.NET desktop build tools
Desktop development with C++
و.NET. قم بتنزيل أدوات إنشاء Microsoft C++ وقم بتثبيت هذه التبعيات.
استنساخ الريبو
git clone https://github.com/alxpez/alts.git
انتقل إلى المجلد الرئيسي
cd alts/
تثبيت تبعيات المشروع
pip install -r requirements.txt
راجع قسم المتطلبات المسبقة للتأكد من أن جهازك جاهز لبدء تشغيل ALTS
تكرار وإعادة تسمية ملفات التكوين المطلوبة
cp config-template.yaml config.yaml
cp .env.template .env
تعديل التكوين الافتراضي لاحتياجاتك
بدء تشغيل ALTS
sudo python alts.py
تتطلب حزمة
keyboard
تشغيلها كمسؤول (في نظامي التشغيل macOS وLinux)، لكن هذا ليس هو الحال في نظام التشغيل Windows