사용자 정의 가능한 AI 성격 및 음성을 통해 PC에서 완전히 로컬인 AI와 실시간 대화를 제공합니다.
힌트: 최첨단 음성 솔루션에 관심이 있는 사람이라면 누구나 Linguflex를 살펴보시기 바랍니다. 말로 환경을 제어할 수 있으며 현재 사용할 수 있는 가장 유능하고 정교한 오픈 소스 도우미 중 하나입니다.
참고: '일반 합성 오류: isin()이 잘못된 인수 조합을 받았습니다' 오류가 발생하는 경우 이는 Coqui TTS(여기 참조)에 대한 비호환성을 도입하는 새로운 변환기 라이브러리 때문입니다. 이전 변환기 버전으로 다운그레이드하세요:
pip install transformers==4.38.2
또는 RealtimeTTS를 최신 버전pip install realtimetts==0.4.1
로 업그레이드하세요.
강력한 Zephyr 7B 언어 모델을 실시간 음성-텍스트 및 텍스트-음성 라이브러리와 통합하여 빠르고 매력적인 음성 기반 로컬 챗봇을 만듭니다.
힌트: llama.cpp를 설치하는 데 문제가 발생하면 내 LocalEmotionalAIVoiceChat 프로젝트도 살펴보세요. 감정 인식 실시간 텍스트 음성 변환 출력이 포함되어 있으며 다양한 LLM 제공업체 옵션이 있습니다. 다양한 AI 모델과 함께 사용할 수도 있습니다.
이 소프트웨어는 실험적인 알파 상태이며 생산 준비 안정성을 제공하지 않습니다. 합성에 사용되는 현재 XTTS 모델에는 여전히 결함이 있으며 Zephyr도 7B 모델에는 매우 좋지만 물론 GPT 4, Claude 또는 Perplexity의 답변 품질과 경쟁할 수 없습니다.
이를 로컬 실시간 챗봇의 초기 버전 제공을 위한 첫 번째 시도로 삼아주세요.
이를 실시간으로 실행하려면 약 8GB VRAM을 갖춘 GPU가 필요합니다.
NVIDIA CUDA 툴킷 11.8 :
CUDA 11.x용 NVIDIA cuDNN 8.7.0 :
ROCm v.5.7.1 설치
FFmpeg :
운영 체제에 따라 FFmpeg를 설치하십시오.
우분투/데비안 :
sudo apt update && sudo apt install ffmpeg
아치 리눅스 :
sudo pacman -S ffmpeg
macOS(홈브루) :
brew install ffmpeg
윈도우(초콜릿) :
choco install ffmpeg
Windows(특종) :
scoop install ffmpeg
저장소를 복제하거나 소스 코드 패키지를 다운로드하세요.
llama.cpp 설치
(AMD 사용자의 경우) 다음 단계 전에 env 변수 LLAMA_HIPBLAS
값을 on
으로 설정합니다.
공식적인 방법:
pip install llama - cpp - python - - force - reinstall - - upgrade - - no - cache - dir - - verbose
실시간 라이브러리 설치
pip install RealtimeSTT == 0.1 . 7
pip install RealtimeTTS == 0.2 . 7
여기에서 zephyr-7b-beta.Q5_K_M.gguf를 다운로드하세요.
model_path
에 입력하세요.종속성 충돌이 발생하면 충돌하는 라이브러리의 특정 버전을 설치하십시오.
pip install networkx == 2.8 . 8
pip install typing_extensions == 4.8 . 0
pip install fsspec == 2023.6 . 0
pip install imageio == 2.31 . 6
pip install numpy == 1.24 . 3
pip install requests == 2.31 . 0
python ai_voicetalk_local.py
chat_params.json을 열어 대화 시나리오를 변경하세요.
두 번째 문장에 도달하기 전에 첫 번째 문장이 전사되면 AudioToTextRecorder에서 post_speech_silence_duration을 높입니다. AudioToTextRecorder(model="tiny.en", language="en", spinner=False, post_speech_silence_duration = 1.5)
프로젝트를 향상하거나 개선하기 위한 기여를 따뜻하게 환영합니다. 제안된 변경 사항이나 수정 사항이 포함된 풀 요청을 자유롭게 열어주세요.
이 프로젝트는 Coqui Public Model License 1.0.0을 따릅니다.
이 라이선스는 기계 학습 모델과 그 결과의 비상업적 사용만을 허용합니다.
콜자 베이겔
이 프로젝트와 관련된 질문이나 지원이 있으면 언제든지 문의하세요.