Puede extraer rápidamente el contenido de audio y video y llamar a un modelo grande para organizarlo en una nota de rebajas estructurada para una lectura fácil y rápida.
FunASR: https://github.com/modelscope/FunASR
Qwen2: https://ollama.com/library/qwen2
Descargue el paquete de instalación de Ollama correspondiente al sistema e instálelo.
https://ollama.com/download
Tomo阿里的千问2 7b
como ejemplo https://ollama.com/library/qwen2
ollama pull qwen2:7b
Hay dos métodos de implementación, uno es implementar usando Docker y el otro es implementar localmente.
curl -fsSL https://github.com/harry0703/AudioNotes/raw/main/docker-compose.yml -o docker-compose.yml
docker-compose up
Después de que se inicie Docker, visite http://localhost:15433/
La cuenta de inicio de sesión es admin y la contraseña es admin (se puede modificar en el archivo docker-compose.yml)
Se requiere una base de datos postgresql accesible
conda create -n AudioNotes python=3.10 -y
conda activate AudioNotes
git clone https://github.com/harry0703/AudioNotes.git
cd AudioNotes
pip install -r requirements.txt
Cambie el nombre .env.example
a .env
y modifique la información de configuración relevante
chainlit run main.py
Una vez iniciado el servicio, visite http://localhost:8000/
La cuenta de inicio de sesión es admin y la contraseña es admin (se puede modificar en el archivo .env)