NoteTakerGPT هو برنامج نصي مصمم لنسخ وتلخيص التسجيلات الصوتية، وهو مصمم خصيصًا للاجتماعات. الفكرة الأساسية وراء NoteTakerGPT هي تحويل المهمة المرهقة المتمثلة في تدوين الملاحظات إلى عملية تلقائية من خلال الاستفادة من القدرات الرائعة لنموذج OpenAI's GPT-4.
يعد هذا البرنامج النصي رفيقًا مثاليًا للمحترفين الذين يحضرون الاجتماعات بشكل متكرر ويحتاجون إلى أداة موثوقة لالتقاط التفاصيل الأساسية. فهو يوفر الوقت ويزيد الإنتاجية ويضمن عدم فقدان أي معلومات مهمة أو إغفالها. إن مخرجات البرنامج النصي عبارة عن مجموعة شاملة جيدة التنظيم من الملاحظات النقطية التي توفر ملخصًا واضحًا للاجتماع.
يجمع برنامج NoteTakerGPT بين قوة العديد من مكتبات Python وواجهة برمجة تطبيقات OpenAI للتعامل مع التسجيل الصوتي والنسخ وتقطيع النص والتلخيص. فهو ينفذ كل هذه المهام في الوقت الفعلي، مما يضمن أن الملاحظات جاهزة بعد وقت قصير من انتهاء الاجتماع. علاوة على ذلك، يتعامل NoteTakerGPT مع العملية بأكملها بطريقة تحافظ على خصوصية وأمان بياناتك. إنها أداة قوية ومتعددة الاستخدامات تعمل على تبسيط عملية تدوين الملاحظات.
سترشدك هذه الإرشادات حول كيفية تشغيل المشروع على جهازك المحلي لأغراض التطوير والاختبار.
يحتوي المشروع على بعض التبعيات التي يجب تثبيتها حتى يعمل بشكل صحيح. التبعيات تشمل:
يمكنك تثبيت هذه التبعيات باستخدام النقطة:
pip install requests openai pandas numpy tiktoken pyaudio wave keyboard
git clone https://github.com/yourusername/NoteTakerGPT.git
cd NoteTakerGPT
pip install -r requirements.txt
python NoteTakerGPT.py
لاستخدام NoteTakerGPT، اتبع الخطوات التالية:
python NoteTakerGPT.py
سيبدأ البرنامج النصي تلقائيًا في تسجيل الصوت ونسخه. ستستمر عملية النسخ والتلخيص حتى يحدث حدث KeyboardInterrupt (عادةً بالضغط على Ctrl+C).
في نهاية عملية النسخ والتلخيص، سيقوم البرنامج النصي بإخراج مجموعة شاملة من الملاحظات النقطية المستمدة من الصوت المسجل.
في قلب NoteTakerGPT توجد عملية معقدة تتضمن عدة مراحل. تم تصميم كل مرحلة لضمان تحويل البيانات الصوتية الأولية إلى مجموعة منظمة وشاملة من الملاحظات. وفيما يلي نظرة أكثر تعمقا في كل مرحلة:
تسجيل الصوت : تتضمن المرحلة الأولى تسجيل الصوت. يتم ذلك باستخدام مكتبة PyAudio، التي توفر روابط Python لـ PortAudio، مكتبة الإدخال/الإخراج الصوتية عبر الأنظمة الأساسية. يقوم البرنامج النصي بتسجيل الصوت على فترات زمنية مدتها 30 ثانية لضمان سهولة الإدارة والكفاءة في الخطوات اللاحقة. في نهاية كل فاصل زمني، يتم حفظ البيانات الصوتية كملف .wav.
النسخ : بمجرد تخزين البيانات الصوتية، يبدأ البرنامج النصي عملية النسخ. يتم ذلك عن طريق إرسال البيانات الصوتية إلى نظام Whisper ASR (التعرف التلقائي على الكلام) الخاص بـ OpenAI عبر OpenAI API. يقوم بنسخ البيانات الصوتية إلى نص، ثم يتم إعادته بعد ذلك إلى البرنامج النصي. تعمل عملية النسخ في عملية منفصلة لضمان عدم حظر عملية التسجيل واستمرارها بسلاسة.
التقطيع والتحليل : عند استلام بيانات النسخ، يتم تقسيمها إلى أجزاء يمكن التحكم فيها لتحليلها. يأخذ هذا في الاعتبار حد الرمز المميز الذي تمتلكه OpenAI API لكل طلب. يقوم البرنامج النصي بتقسيم النسخ إلى أجزاء ويرسل كل منها إلى نموذج GPT-4 الخاص بـ OpenAI لتلخيصها. يصاحب كل جزء رسالة مطالبة ترشد النموذج إلى قراءة النص وإنشاء ملاحظات تفصيلية تلخص المحتوى.
توحيد الملاحظات : بعد تحليل جميع الأجزاء وتلخيصها، يدخل البرنامج النصي إلى المرحلة النهائية: دمج الملاحظات. هنا، يتم جمع كافة النقاط الملخصة وتنسيقها في مجموعة واحدة شاملة من الملاحظات. يتم ذلك بواسطة # NoteTakerGPT آخر
لاستخدام NoteTakerGPT، اتبع الخطوات التالية:
python NoteTakerGPT.py
سيبدأ البرنامج النصي تلقائيًا في تسجيل الصوت ونسخه. ستستمر عملية النسخ والتلخيص حتى يحدث حدث KeyboardInterrupt (عادةً بالضغط على Ctrl+C).
في نهاية عملية النسخ والتلخيص، سيقوم البرنامج النصي بإخراج مجموعة شاملة من الملاحظات النقطية المستمدة من الصوت المسجل.
المساهمات هي دائما موضع ترحيب! للمساهمة في هذا المشروع، يرجى تفرع المستودع وإرسال طلب سحب.
هذا المشروع مرخص بموجب شروط ترخيص MIT. راجع ملف الترخيص للحصول على النص الكامل. يتيح لك هذا استخدام التعليمات البرمجية وتعديلها وتوزيعها في مشاريعك الخاصة طالما قمت بتضمين إشعار حقوق الطبع والنشر الأصلي وإخلاء المسؤولية.