Android SmartWatch와 유사한 버전은 다른 Repo GPT-Assistants Interlink를 참조하십시오. 이 프로젝트는 OpenAI의 조수 API를 활용합니다.
(오래된 완성 엔진을 위해 만들어지고 Chatgpt 용으로 개조되었습니다. 현대적인 것들만큼 좋지 않습니다. 계속 찾고 있습니다.)
이것은 마이크를 사용하여 Chatgpt 또는 GPT-4와 매력적이고 안전하게 감동적인 대화를 할 수있는 봇입니다. 말하지 않고 입력하고자하는 경우 터미널을 통해 봇과 대화 할 수도 있습니다.
이 도구는 수정 된 GPT 채팅 사전 설정을 사용하고 대화 추적을 처리하며 Chatgpt의 API를 기본적으로 사용합니다. 당신은 GPT를 말할 수 있으며 세션에 대해 말한 내용을 기억하고 원하는 경우 봇이 시간이 지남에 따라 기억을 개발하도록 할 수도 있습니다. GPT의 최대 토큰 수를 기반으로 한 제한 사항에도 불구하고 GPT-VCC는 당신이 말한 것에 대한 인식을 잃지 않고 원하는만큼 오랫동안 당신과 대화 할 수 있어야합니다. 이 도구를 사용하려면 유효한 OpenAI API 키가 필요합니다.
봇은 너무 많은 대기 시간없이 OpenAI의 중재 및 GPT API가 제대로 작동해야합니다. 여기에서 상태를 찾을 수 있습니다 : https://status.openai.com/
릴리스는 이전 테스트가 진행되는 한 안정적이어야하지만 최신 기능을 모두 갖지는 않습니다. 여기에 나열된 모든 기능을 사용하려면 저장소를 복제하고 때때로 'Git Pull'을 실행하십시오. 이렇게하면 최신 기능과 버그 수정이 올 수 있지만 불안정 할 수 있습니다.
(참고 : Wisetech는 내 봇 인스턴스 자체를 선택한 이름입니다)
먼저 OpenAI API 키가 필요합니다. https://openai.com/api/에서 API 키를 얻기 위해 계정을 만들 수 있습니다.
로그인하면 오른쪽 상단의 "개인"텍스트 옆의 원을 누르십시오. 그런 다음 "API 키보기"를 누릅니다.
"새 비밀 키 만들기"를 누른 다음 해당 키를 저장하십시오. 이것이 GPT-VCC를 실행하는 데 필요한 열쇠입니다. 다음과 같은 방법으로 포함 된 키 TXT 파일에 붙여 넣습니다.
OpenAI_Key={paste here without brackets}
화면 왼쪽의 "청구"탭으로 이동하십시오. GPT-VCC를 계속 사용하기 위해 무료 크레딧이 부족할 때 지불 계획을 시작하십시오.
https://www.python.org/에서 Python 다운로드
릴리스를 통해이 repo를 다운로드하거나, repo를 복제하거나, 코드 버튼을 오른쪽 상단으로 누르고 "zip 다운로드"를 누릅니다.
내용을 추출한 다음 파일로 폴더로 이동하십시오.
Windows 터미널이 설치된 경우 폴더의 빈 부분을 마우스 오른쪽 버튼으로 클릭하고 '터미널에서 열기'를 선택하십시오. 그렇지 않으면 Win + R을 사용하고 PowerShell을 입력하십시오. 터미널 창에 있고 적절한 디렉토리에 있으면 "PIP Install -r 요구 사항.txt -Upgrade"를 사용하십시오. 이 작업이 성공적으로 완료되면 OpenAI API 키를 얻 자마자 갈 준비가되어 있어야합니다.
GPT-VCC 사용에 나열된 단계를 따르십시오
PIP3를 설치하십시오
sudo apt install python3-pip
릴리스를 통해이 repo를 다운로드하거나, repo를 복제하거나, 코드 버튼을 오른쪽 상단으로 누르고 "zip 다운로드"를 누릅니다.
파일 추출, 디렉토리로 이동하고, ventired.txt를 열고, 파일에서 pyaudio == 0.2.13을 삭제하십시오. 원래 형식을 보존하여 결코 거기에 없었던 것처럼 보이게하십시오.
다음과 같이 apt로 pyaudio를 다운로드하십시오.
sudo apt install python3-pyaudio
다음과 같이 APT로 ESPEAK를 다운로드합니다 (인터페이스 커뮤니케이션에 필요) :
sudo apt install espeak
다음과 같이 PIP로 기타 요구 사항을 다운로드하십시오.
pip3 install -r requirements.txt --upgrade
GPT-VCC 사용에 나열된 단계를 따르십시오
이 챗봇을 사용하려면 봇 폴더로 탐색 한 후 다음 명령을 입력하십시오 (<key> API 키로 바꾸는) :
python main.py <key>
편의를 위해 키를 keys.txt 파일에 입력 할 수도 있습니다. 스크립트를 실행하면 봇이 자동 으로이 파일을 읽고 키를로드합니다.
Pygame Gui가 나타납니다. 색상은 봇의 상태를 나타냅니다. 색상 빨간색은 봇이 듣고 있지 않음을 나타냅니다. 봇이 당신의 말을 듣게하려면 공간을 누릅니다. 그런 다음 로딩 할 때 색상이 노란색으로 변하고 듣고있을 때 녹색으로 변합니다. 색상이 녹색 일 때 자유롭게 말하면 연설이 녹음되고 텍스트로 변환 된 다음 OpenAi의 정책을 준수하는 경우 GPT에 공급됩니다. GPT가 응답 할 준비가되면 화면이 파란색으로 변합니다.
터미널을 사용하려면 동일한 구문을 사용하여 gptcli.py를 실행하십시오 (KeyFile도 작동).
python gptcli.py <key>
elevenlabs tts를 사용하려면 OpenAI API 키를 따르는 개인 elevenlabs API 키를 다음과 같이 입력하거나 키 파일의 키를 작성해야합니다.
python main.py <OpenAI key> <ElevenLabs TTS key>
멋진 TTS를 사용하지 않으려면이 봇은 자동으로 Google의 TTS를 사용합니다.
중재는 OpenAI의 중재 도구와 NLTK를 모두 사용합니다. 결합하여 그들은 OpenAI의 USEAGE 정책 외부에있는 GPT의 사용을 막기를 희망합니다. 이것은 무너질 수있는 방법이 아니므로 GPT를 제공하는 것에주의를 기울이십시오.
중재 API의 정전 또는 대기 시간 문제로 인해이 챗봇을 사용하지 못하게됩니다. OpenAi에 문제가있는 동안 봇과 대화 해야하는 경우 "self.flagged_by_openai (text)"조건을 제외하기 위해 Chatbot.py 파일을 편집하십시오. 나는 이것을 권장하지 않습니다.
프로그램을 시작할 때 통과 된 인수를 사용하려면 대체 음성을 사용할 수 있습니다. 미래 에이 작업을 수행하는 방법이 계획됩니다. 지금은 사용하려는 음성의 신분증을 알아야합니다 (여기에서 기본 음성 ID 목록을 찾을 수 있습니다). 해당 ID를 알고 나면 Rachel의 예제 ID "21M00TCM4TLVDQ8IKWAM"과 함께 다음과 같이 사용하십시오.
python main.py --voice_id 21m00Tcm4TlvDq8ikWAM
복제 된 목소리를 사용하려면 다음을 수행하십시오.
https://beta.elevenlabs.io/voice-lab의 Voice Lab으로 이동하여 사용자 정의 음성을 만듭니다.
음성 복제가 복제되면 https://api.elevenlabs.io/docs#/voices/get_voices_v1_voices_get을 여기로 이동하십시오.
"Try It Out"을 누르고 API 키를 상자에 입력 한 다음 "Execute"를 누릅니다.
실행 버튼 아래에는 "응답 본문"이라는 상자가 표시됩니다. 이름을 딴 목소리를 찾을 때 까지이 상자를 아래로 스크롤하십시오. 바로 위에있는 "음성 _id"를 가져 와서 위의 예에서 사용하십시오.
Spacebar : 이것은 녹음을 시작하고 중지합니다. 당신이 말하는 것이 무엇이든, 두 번째로 공간을 누르면 GPT (필터를 통과하는 경우)로 전송됩니다.
탈출 : 이것은 암기하지 않고 종료됩니다.
Q : 이것은 당신과 당신의 대화에 대한 세부 사항을 기억하고 봇을 기억합니다 (데이터는 memories.txt라는 텍스트 파일에 저장됩니다).
P : 메시지를 취소하기위한 감가 상각 명령입니다. 이제 녹음하는 동안 "메시지를 취소하십시오"라고 말하십시오.
'토큰을 #로 설정하십시오' : 봇 이이 문구를 인식 할 때, 당신이 지정한 값에 대한 답장의 max_tokens를 설정하려고합니다.
'로봇처럼 말하기' : 이렇게하면 GPT의 모든 응답이 오프라인으로 작동하는 로봇 TTS 프로그램으로 말할 수 있습니다. CLI 모드에서 '! robospeak ()'를 입력 하여이 모드를 전환하십시오.
'로봇처럼 말하지 마라' : 이것은 봇의 tts를 이전에 가지고 있던 곳으로 되돌립니다 (Google 또는 elevenlabs tts). CLI 모드에서 '! robospeak ()'를 입력 하여이 모드를 전환하십시오.
'대화를 표시하십시오' : 이렇게하면 전체 대화가 터미널 창에 출력됩니다.
'추억을 표시하십시오' : 이것은 장기 저장소에 저장된 모든 기억의 결과를 제공합니다.
'메모리를 복원하십시오' : 이것은 장기 스토리지에서 특정 수의 기억을 통합하여 봇의 작업 메모리를 수리하려고 시도합니다.
'사전 설정을 설정하십시오' : 봇의 사전 설정 (모든 대화 시작시 AI에 주어진 텍스트 문자열)이 설정됩니다. 예를 들어, 사전 설정된 '해적처럼 말하는 것'은 ai가 해적처럼 말합니다. 여기에서 예측 사전 설정을 찾을 수 있습니다 : https://github.com/adri6336/gpt-voice-conversation-chatbot/wiki/example-presets.
'사전 설정을 재설정하십시오' : 이것은 당신이 만든 사전 설정을 삭제합니다.
'이름을 설정하십시오' : OpenAI의 사용 정책에 따라 봇 이름을 지정한 모든 것에 설정합니다. 이름을 설정 한 후 봇은 설정 한 이름으로 자체를 나타냅니다.
'GPT4를 전환하십시오' : 이것은 Chatgpt와 GPT-4 모델 사이를 전환합니다. 시작하면 스위치가 보존됩니다. CLI 모드에서는 '! gpt4 ()'를 입력하여 모델을 전환합니다.
'창의성을 설정하십시오' : 봇의 기본 무작위성을 1에서 15 사이의 값 (9)으로 설정합니다. CLI 모드에서 '! 창의성 ( #)' ' # 부호는 0.01에서 1.5 사이의 값입니다.
'명령을 나열하십시오' : 봇에 사용 가능한 명령을 나열합니다.
'Elevenlabs를 전환하십시오' : 이것은 봇의 elevenlabs tts on and off를 전환합니다. CLI 모드에서는! 11ai ()를 사용하여 전환하십시오.
'메시지를 취소하십시오' : 메시지가 취소되어 GPT로 전송되는 것을 방지합니다.
ChatGpt 또는 GPT-4와 개인화 된 대화를 나누십시오
GPL의 TTS 도구 (가능한 경우 정확하게 악센트를 발음 할 것임), ElevenLab의 실물 같은 TTS (유효한 API 키가있는 경우) 또는 로봇 ( "로봇처럼 말하기")으로 GPT 대화를 듣습니다.
Google의 음성 인식 기술을 사용하여 GPT Outloud와 대화하십시오
봇은 'Q'키로 닫으면 당신에 대한 것을 기억할 것입니다.
터미널 창의 텍스트로 GPT 회신을 참조하십시오. 대부분의 UTF-32 문자 (중국어 및 아랍어 텍스트 등)도 인쇄됩니다.
당신이 말한 내용을 추적하는 데 도움이되도록 디스크의 파일에 대화를 자동으로 저장하십시오.
귀하와 귀하의 요구에 더 적합한 경험을 갖도록 사용자 정의 사전 설정을 저장하십시오.
봇 이름을 사용자 정의하십시오
봇의 창의성을 사용자 정의하십시오
터미널 (Windows 및 Linux)을 통해 GPT와 채팅
레크리에이션으로 봇과 대화하십시오
봇을 사용하여 사전 설정을 통해 언어를 연습하여 교사처럼 해당 언어로 대화하고 Google의 TTS를 사용하여 적절한 발음에 대한 응답을 듣습니다. 원하는 경우 ElevenLabs의 다국어 목소리를 고수 할 수도 있습니다.
봇이 질문을하고 코드에 대한 피드백을 제공하여 프로그래밍을 연습하는 데 도움이됩니다.
팝업이 튀어 나오는 다양한 것들에 대해 봇 질문을하십시오
봇에게 커버 레터 및 설명을 작성하는 데 도움이되도록 요청하십시오.
elevenlabs 음성 데모
Google TTS 스페인어 음성 데모