NoteTakerGPT ist ein Skript zum Transkribieren und Zusammenfassen von Audioaufzeichnungen, das speziell auf Besprechungen zugeschnitten ist. Die Kernidee von NoteTakerGPT besteht darin, die umständliche Aufgabe des Notizenmachens in einen automatisierten Prozess umzuwandeln, indem die bemerkenswerten Fähigkeiten des GPT-4-Modells von OpenAI genutzt werden.
Dieses Skript ist ein perfekter Begleiter für Berufstätige, die häufig an Besprechungen teilnehmen und ein zuverlässiges Tool zum Erfassen der wichtigsten Details benötigen. Das spart Zeit, erhöht die Produktivität und stellt sicher, dass keine wichtigen Informationen verloren gehen oder übersehen werden. Das Ergebnis des Skripts ist ein gut strukturierter, umfassender Satz von Stichpunktnotizen, die eine klare Zusammenfassung des Meetings liefern.
NoteTakerGPT kombiniert die Leistungsfähigkeit mehrerer Python-Bibliotheken und der OpenAI-API für die Audioaufzeichnung, Transkription, Textaufteilung und Zusammenfassung. Es führt alle diese Aufgaben in Echtzeit aus und stellt sicher, dass die Notizen kurz nach Ende einer Besprechung fertig sind. Darüber hinaus wickelt NoteTakerGPT den gesamten Prozess so ab, dass die Privatsphäre und Sicherheit Ihrer Daten gewahrt bleibt. Es handelt sich um ein robustes und vielseitiges Tool, das das Notieren vereinfacht.
Diese Anweisungen helfen Ihnen dabei, das Projekt zu Entwicklungs- und Testzwecken auf Ihrem lokalen Computer zum Laufen zu bringen.
Das Projekt weist einige Abhängigkeiten auf, die installiert werden müssen, damit es ordnungsgemäß funktioniert. Zu den Abhängigkeiten gehören:
Sie können diese Abhängigkeiten mit pip installieren:
pip install requests openai pandas numpy tiktoken pyaudio wave keyboard
git clone https://github.com/yourusername/NoteTakerGPT.git
cd NoteTakerGPT
pip install -r requirements.txt
python NoteTakerGPT.py
Um NoteTakerGPT zu verwenden, befolgen Sie diese Schritte:
python NoteTakerGPT.py
Das Skript beginnt automatisch mit der Aufnahme und Transkription von Audio. Der Transkriptions- und Zusammenfassungsprozess wird fortgesetzt, bis ein KeyboardInterrupt-Ereignis auftritt (normalerweise durch Drücken von Strg+C).
Am Ende des Transkriptions- und Zusammenfassungsprozesses gibt das Skript einen umfassenden Satz von Stichpunktnotizen aus, die aus dem aufgezeichneten Audio abgeleitet sind.
Das Herzstück von NoteTakerGPT ist ein komplizierter Prozess, der mehrere Phasen umfasst. Jede Stufe ist darauf ausgelegt, die Umwandlung roher Audiodaten in einen strukturierten, umfassenden Satz von Notizen sicherzustellen. Hier ist ein detaillierterer Einblick in jede Phase:
Audioaufnahme : In der ersten Phase wird der Ton aufgenommen. Dies erfolgt mithilfe der PyAudio-Bibliothek, die Python-Bindungen für PortAudio, die plattformübergreifende Audio-I/O-Bibliothek, bereitstellt. Das Skript zeichnet Audio in 30-Sekunden-Intervallen auf, um die Verwaltbarkeit und Effizienz der nachfolgenden Schritte sicherzustellen. Am Ende jedes Intervalls werden die Audiodaten als .wav-Datei gespeichert.
Transkription : Sobald die Audiodaten gespeichert sind, leitet das Skript den Transkriptionsprozess ein. Dazu werden die Audiodaten über die OpenAI-API an das Whisper ASR-System (Automatic Speech Recognition) von OpenAI gesendet. Es transkribiert die Audiodaten in Text, der dann an das Skript zurückgegeben wird. Der Transkriptionsprozess läuft in einem separaten Prozess ab, um sicherzustellen, dass der Aufnahmevorgang nicht blockiert wird und reibungslos fortgesetzt wird.
Chunking und Analyse : Wenn die Transkriptionsdaten empfangen werden, werden sie zur Analyse in überschaubare Blöcke zerlegt. Dabei wird das Token-Limit berücksichtigt, das die OpenAI-API für jede Anfrage hat. Das Skript teilt die Transkriptionen in Blöcke auf und sendet sie jeweils zur Zusammenfassung an das GPT-4-Modell von OpenAI. Zu jedem Abschnitt gibt es eine Aufforderung, die das Modell anweist, den Text zu lesen und detaillierte Aufzählungsnotizen zu erstellen, die den Inhalt zusammenfassen.
Notizenkonsolidierung : Nachdem alle Blöcke analysiert und zusammengefasst wurden, tritt das Skript in die letzte Phase ein: Notizenkonsolidierung. Hier werden alle zusammengefassten Punkte gesammelt und in einem einzigen, umfassenden Notizsatz formatiert. Dies wird von einem anderen # NoteTakerGPT erledigt
Um NoteTakerGPT zu verwenden, befolgen Sie diese Schritte:
python NoteTakerGPT.py
Das Skript beginnt automatisch mit der Aufnahme und Transkription von Audio. Der Transkriptions- und Zusammenfassungsprozess wird fortgesetzt, bis ein KeyboardInterrupt-Ereignis auftritt (normalerweise durch Drücken von Strg+C).
Am Ende des Transkriptions- und Zusammenfassungsprozesses gibt das Skript einen umfassenden Satz von Stichpunktnotizen aus, die aus dem aufgezeichneten Audio abgeleitet sind.
Beiträge sind jederzeit willkommen! Um zu diesem Projekt beizutragen, forken Sie bitte das Repository und senden Sie eine Pull-Anfrage.
Dieses Projekt ist unter den Bedingungen der MIT-Lizenz lizenziert. Den vollständigen Text finden Sie in der LICENSE-Datei. Dadurch können Sie den Code in Ihren eigenen Projekten verwenden, ändern und verteilen, sofern Sie den ursprünglichen Urheberrechtshinweis und Haftungsausschluss angeben.