Présentation • Fonctionnalités • QuickStart • Contribution
Demo de la transcription rapide de Scribewizard de l'audio et de la génération de notes structurées
Scribewizard est une application rationalisée qui échafaudage la création de notes de conférence structurées en structurant et en générant des notes itérativement à partir de conférences audio transcrites utilisant l'API Whisper de Groq. L'application mélange LLAMA3-8B et LLAMA3-70B, utilisant le modèle plus grand pour générer la structure des notes et la plus rapide des deux pour créer le contenu.
Exemple | Lien youtube |
---|---|
Transformers expliqués par Google Cloud Tech | https://www.youtube.com/watch?v=szoraj4i-sa |
L'essence du calcul par 3Blue1brown | https://www.youtube.com/watch?v=wuvtyaankzm |
Comme pour toutes les IA génératives, le contenu peut inclure des informations inexactes ou d'espace réservé. Scribewizard est en version bêta et tous les commentaires sont les bienvenus!
Important
Pour utiliser Scribewizard, vous pouvez utiliser une version hébergée sur scribewizard.streamlit.app. Alternativement, vous pouvez exécuter ScribEwizard localement avec Streamlit en utilisant les instructions QuickStart.
Pour utiliser Scribewizard, vous pouvez utiliser la version hébergée sur scribewizard.streamlit.app
Alternative, vous pouvez exécuter Scribewizard localement avec Streamlit.
Tout d'abord, vous pouvez définir votre clé API GROQ dans les variables d'environnement:
export GROQ_API_KEY="gsk_yA..."
Il s'agit d'une étape facultative qui vous permet de sauter la définition de la touche API GROQ plus tard dans l'application Streamlit.
Ensuite, vous pouvez configurer un environnement virtuel et installer les dépendances.
python3 -m venv venv
source venv/bin/activate
pip3 install -r requirements.txt
Enfin, vous pouvez exécuter l'application Streamlit.
python3 -m streamlit run main.py
Scribewizard peut générer des informations inexactes ou un contenu d'espace réservé. Il doit être utilisé pour générer des notes à des fins de divertissement uniquement.
Les améliorations via PRS sont les bienvenues!
Cette version est une version initiale de la base de code d'application. Il comprend les fonctionnalités suivantes:
Générez des notes structurées à l'aide de l'audio transcrit par chuchotement et du texte par llama3
⚡ Lightning Fast Speed Transcrire audio et générer du texte à l'aide de GROQ
Échafaudé provoquer des changements stratégiquement entre LLAMA3-70B et LLAMA3-8B pour équilibrer la vitesse et la qualité
Markdown Styling crée des notes esthétiques sur l'application Streamlit qui peut inclure des tables et du code
Permet à l'utilisateur de télécharger un fichier texte ou pdf avec les notes entières