Übersicht • Funktionen • QuickStart • Beitrag zum Mitnehmen
Demo der Schnelle Transkription von Audio und Erzeugung strukturierter Notizen
Scribewizard ist eine streamlitische App, die die Erstellung strukturierter Vorlesungsnotizen durch iterativ strukturierende und generierende Notizen von transkribierten Audiovorträgen unter Verwendung von GROSPER -API erstellt und generiert. Die App mischt LLAMA3-8B und LLAMA3-70B, wobei das größere Modell zur Erzeugung der Notenstruktur und der schnelleren der beiden zum Erstellen des Inhalts verwendet wird.
Beispiel | YouTube -Link |
---|---|
Transformers, die von Google Cloud Tech erklärt wurden | https://www.youtube.com/watch?v=szoraj4i-sa |
Die Essenz des Kalküls durch 3Blue1Brown | https://www.youtube.com/watch?v=wuvtyaankzm |
Wie bei allen generativen KI können Inhalte ungenaue oder Platzhalterinformationen enthalten. Scibewizard ist in Beta und alle Feedback sind willkommen!
Wichtig
Um Scribewizard zu verwenden, können Sie eine gehostete Version bei Scribewizard.StreamLit.app verwenden. Alternativ können Sie ScribeWewardard lokal mit Stromflächen mit den QuickStart -Anweisungen ausführen.
Um Scribewizard zu verwenden, können Sie die gehostete Version bei Scribewizard.StreamLit.App verwenden
Alternative können Sie Scribewizard lokal mit stromloser Ausführung ausführen.
Zunächst können Sie Ihren COQ -API -Schlüssel in den Umgebungsvariablen einstellen:
export GROQ_API_KEY="gsk_yA..."
Dies ist ein optionaler Schritt, mit dem Sie später in der Streamlit -App die CROQ -API -Taste einstellen können.
Als nächstes können Sie eine virtuelle Umgebung einrichten und die Abhängigkeiten installieren.
python3 -m venv venv
source venv/bin/activate
pip3 install -r requirements.txt
Schließlich können Sie die Streamlit -App ausführen.
python3 -m streamlit run main.py
Scribewizard kann ungenaue Informationen oder Platzhalterinhalte generieren. Es sollte verwendet werden, um Noten nur für Unterhaltungszwecke zu generieren.
Verbesserungen durch PRs sind willkommen!
Diese Version ist eine erste Version der AnwendungscodeBase. Es enthält die folgenden Funktionen:
Generieren Sie strukturierte Notizen mit transkribiertem Audio von Whisper-Large und Text von LLAMA3
⚡ Lightning Fast Speed Transkripting Audio und Erzeugung von Text mit COQ
Gerüste, die strategisch wechseln zwischen LLAMA3-70B und LAMA3-8B, um Geschwindigkeit und Qualität auszugleichen
Das Markdown -Styling erstellt ästhetische Hinweise zur Streamlit -App, die Tabellen und Code enthalten kann
Ermöglicht dem Benutzer, eine Text- oder PDF -Datei mit dem gesamten Notizeninhalt herunterzuladen