JARVIS ChatGPT 다운로드 - JARVIS ChatGPT 소스 코드 다운로드

JARVIS ChatGPT

기타 소스코드

1.0.0

다운로드

Jarvis-Chatgpt : Jarvis의 목소리가 장착 된 대화 조수

다양한 합성 목소리가 장착 된 음성 기반의 대화 형 보조원 (Ironman의 Jarvis의 목소리 포함)

MidJourney AI의 이미지

갑옷을 개선하기 위해 하이퍼 지능 시스템 팁을 요청하는 꿈을 꾸었습니까? 이제 당신은 할 수 있습니다! 글쎄, 아마도 갑옷 부분이 아닐 수도 있습니다 ...이 프로젝트는 Openai Whisper, Openai Chatgpt 및 IBM Watson을 이용합니다.

프로젝트 동기 부여 :

여러 번 아이디어가 최악의 순간에 와서 더 잘 탐색 할 시간이 있기 전에 사라집니다. 이 프로젝트의 목적은 준 진실에 팁과 의견을 제시 할 수있는 시스템을 개발하는 것입니다. Ultimate Assistant는 집이나 휴대 전화 내부의 승인 된 마이크에서 액세스 할 수 있으며, 배경에서 지속적으로 실행해야하며, 소환 할 때는 PC 또는 서버와의 인터페이스뿐만 아니라 나중에 액세스 할 수있는 파일을 저장/읽기/쓰기 할 수 있어야하며, 소환 할 때는 의미있는 답변 (나쁜 음성 포함)을 생성 할 수 있어야합니다. 연구를 실행하고 인터넷에서 자료를 수집 할 수 있어야합니다 (HTML 페이지에서 콘텐츠 추출, YouTube 동영상을 전사하고 과학 논문을 찾는 등) 및 정보에 입각 한 결정을 내릴 수있는 요약을 제공 할 수 있어야합니다. 또한 일부 외부 가제트 (IoT)와 인터페이스 할 수 있지만 추가입니다.

데모:

2023-04-11.23-20-03_trim.mp4

2023 년 7 월 14 일 업데이트 : 연구 모드

Finnaly는 연구 모드의 첫 번째 초안을 공유 할 수 있습니다. 이 양식은 종종 연구 논문을 다루는 사람들에게 생각되었습니다.

'연구 모드로 전환'으로 연구 모드로 전환하십시오.
다음과 같은 새 작업 공간을 초기화 하십시오. 작업 공간은 연구 결과를 수집하고 구성하는 폴더입니다. 이 프로토콜은 3 개의 하위 경로로 세분됩니다.
1. 핵심 논문 식별 : 시맨틱 학자 API를 사용하여 강력하게 관련된 논문을 식별합니다.
2. 핵심 확장 : 각 논문에 대해 몇 가지 제안을 찾은 다음 적어도 2 개의 논문과 유사한 것으로 보이는 제안 만 유지하십시오.
3. refy 확장 : Refy 제안 패키지를 사용하여 결과를 확대합니다.
다음과 같은 제안을 찾으십시오.
다운로드 : '제목이있는 종이 다운로드 ...'
'제목이있는 논문의 저자는 무엇입니까 ...?' '제목이있는 종이의 실험 조건은 무엇입니까 ...?'

추신 :이 모드는 매우 안정적이지 않으며 작업해야합니다.

PPS :이 프로젝트는 2024 년까지 논문을 작업하기 위해 한동안 중단 될 것입니다. 그러나 이미 개선 될 수있는 많은 것들이 너무 많아서 돌아올 것입니다!

필요한 것 :

부인 성명:
이 프로젝트는 OpenAI 신용을 소비하여 바람직하지 않은 청구를 초래할 수 있습니다.
나는 원치 않는 혐의에 대해 책임을지지 않습니다.
OpenAI 계정에서 신용 소비에 대한 제한을 설정하는 것을 고려하십시오.

OpenAI 계정 및 API 키; (대안에 대해서는 아래 FAQ를 확인하십시오)
피코 보이스 계정 및 무료 액세스키; (선택 과목)
elevenlabs 계정 및 무료 API 키 (선택 사항) ;
웹 서핑 용 Langchain API 키 (뉴스, 날씨, Serpapi, Google-Serp, Google 검색 ... 모두 무료입니다)
ffmpeg;
파이썬 가상 환경 (Python> = 3.9 및 <3.10);
chatgpt에 지출하라는 신용 (OpenAI에 가입하여 3 개월의 무료 사용을받을 수 있음) (제안) ;
CUDA 버전> = 11.2;
클라우드 기반 텍스트 음성 연설 모델 (튜토리얼)을 이용하는 IBM 클라우드 계정 (선택 사항) ;
A (합리적으로) 빠른 인터넷 연결 (대부분의 코드는 API에 의존하므로 연결이 느리면 응답 시간이 길어질 수 있습니다).
마이크와 스피커;
CUDA 유능 그래픽 엔진 (내 토치 버전 : 2.0 및 Cuda V11.7 pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu117 );
인내심 ?

당신은 당신을 위해 대부분의 일을 할 새로운 setup.bat 에 의존 할 수 있습니다.

Github 개요

실행 해야하는 기본 스크립트 : openai_api_chatbot.py Demos 폴더 내부에서 최신 버전의 OpenAI API를 사용하려면 프로젝트에 사용 된 패키지에 대한 지침을 찾을 수 있습니다. 오류가 있으면이 파일을 먼저 확인하여 문제를 대상으로 할 수 있습니다. 주로 어시스턴트 폴더에 저장 voice.py . get_audio.py 마이크 상호 작용 tools.py 처리하기위한 모든 기능을 저장합니다. Agents.py
나머지 스크립트는 음성 생성을 보충하며 편집해서는 안됩니다.

설치 자습서

자동 설치

Windows/Linux에서 실행중인 경우 setup.bat 실행할 수 있습니다. 스크립트는 수동 설치의 모든 단계를 순서대로 수행합니다. 절차가 실패 해야하는 경우를 참조하십시오.
자동 설치는 Vicuna 설치 (Vicuna 설치 가이드)도 실행됩니다.

수동 설치

1 단계 : 설치, 계정, API ...

환경

Python 3.8을 사용하여 새로운 빈 가상 환경을 만들고 활성화하십시오 (. venv_name scripts activate);
pip install -r venv_requirements.txt ; 시간이 좀 걸릴 수 있습니다. 특정 패키지에서 충돌이 발생하면 ==<version> 없이 수동으로 설치하십시오.
CUDA 버전에 따라 수동으로 pytorch를 설치하십시오.
whisper_edits 폴더에서 찾은 파일을 환경의 whisper 폴더에 복사하여 붙여 넣습니다 (. venv lib site-packages whisper ) 이 편집은 Whisper 모델에 속성 만 추가하여 차원에 더 쉽게 액세스 할 수 있습니다.
TTS 설치;
스크립트를 실행하고 모든 것이 작동하는지 확인하십시오 (일부 모델을 다운로드해야 함) (또는 demos/tts_demo.py 실행할 수 있음);
TTS 폴더의 이름을 바꾸거나 삭제 하고이 리포지어에서 어시스턴트 및 기타 스크립트를 다운로드하십시오.
Vicuna 폴더의 지침에 따라 또는 실행을 통해 Vicuna를 설치하십시오.
cd Vicuna
call vicuna.ps1
수동 지침은 Vicuna 설치 안내서를 따르도록 지시합니다.
env.txt 파일에 모든 키를 붙여 넣고 .env 로 이름을 바꿉니다 (예, txt 확장자 제거).
모든 것이 작동합니다 (다음)

체크 무늬

Pyhton 내부의 torch.cuda.is_available() 및 torch.cuda.get_device_name(0) 실행하여 Graphic Engine 및 Cuda 버전을 Pytorch와 호환되는지 확인하십시오. .
tests.py 실행합니다. 이 파일은 오류가 발생할 수있는 기본 작업을 수행하려고 시도합니다.
[경고] 오류가있는 경우 아래의 FAQ를 확인하십시오.
데모 폴더에서 데모를 실행하여 오류 소스를 확인할 수 있습니다.

2 단계 : 언어 지원

언어로 답변을 받으려면 먼저 https://cloud.ibm.com/docs/text-speech?topic=text-to-speech-voices 의 언어가 뒷받침되는지 확인해야합니다.
지원되는 경우 VirtualAssistant.__init__() ;

기억하십시오 :로드 된 속삭임은 중간 정도입니다. 그것이 당신의 언어로 잘못 수행되는 경우, whisper_model = whisper.load_model("large") 의 __main__() 의 더 큰 것으로 업그레이드하십시오. 그러나 GPU 메모리도 마찬가지로 크기를 바랍니다.

3 단계 : 실행 ( `openai_api_chatbot.py` ) :

실행할 때 많은 정보가 표시됩니다. 나는 실행의 가독성을 향상시키기 위해 끊임없이 노력하고 있습니다. 전체 프로젝트는 거대한 베타이며 아래 화면에서 약간의 변형을 용서합니다. 어쨌든, 이것은 당신이 'run'을 때릴 때 일반적으로 일어나는 일입니다.

예비 초기화가 이루어지면 조수가 준비되면 차임이 들립니다.
단어를 트리거하기를 기다리는 것이 표시되면 조교를 소환하기 위해 Jarvis 말해야합니다. 이 시점에서 대화가 시작되며 원하는 언어로 말할 수 있습니다 (2 단계를 따르는 경우). 대화가 끝나면 1) 1) 중지 단어 2) 한 단어 ( 'OK'와 같은 단어) 3) 3) 30 초 이상 질문을 중단 할 때

마법의 단어가 말한 후에는 듣고있는 단어가 나타납니다. 이 시점에서 질문을 할 수 있습니다. 완료되면 답변을 제출할 때까지 기다리십시오 (3 초).
스크립트는 Whisper를 사용하여 녹음 된 오디오를 텍스트로 변환합니다.
텍스트는 분석되고 결정이 내려집니다. 어시스턴트가 과거 대화를 찾는 것과 같이 (과거 대화를 찾고) 응답하기 위해 약간의 조치를 취해야한다고 생각한다면 Langchain 에이전트는 계획을 세우고 도구를 사용하여 대답 할 것입니다.
그렇지 않으면, 스크립트는 질문으로 chat_history 를 확장하고 API와 함께 요청을 보내며 ChatGpt로부터 전체 답변을받는 즉시 기록을 업데이트합니다 (이는 최대 5-10 초가 걸릴 수 있으며 서둘러 서둘러 짧은 답변을 명시 적으로 요구하는 것을 고려하십시오).
say() 함수는 Jarvis/누군가의 목소리와 대화하기 위해 음성 복제를 수행합니다. 논쟁이 영어로되어 있지 않으면 IBM Watson은 멋진 텍스트 연설 모델 중 하나에서 응답을 보낼 것입니다. 모든 것이 실패하면 기능은 빠르고 시원한 대안이 아닌 pyttsx3에 의존합니다.

중지 키워드가 말하면 스크립트는 Chatgpt에게 대화에 제목을 부여하고 'currentDate_title.txt'형식으로 .txt 파일로 채팅을 저장합니다.
그런 다음 조수는 다시 잠들 것입니다.

나는 프롬프트를 만들고 대화를 마무리했다

키워드 :

채팅을 중지하거나 저장하려면 어느 시점에서 '감사합니다'라고 말하십시오.
Jarvis Voice를 소환하려면 어느 시점에서 'Jarvis'라고 말합니다.

이상적이지는 않지만 지금은 작동합니다

역사:

현재 작업 :

문서 처리 도구를 확장합니다
Langchain 에이전트를위한 무료 대안을 찾으십시오

수행원:

채팅 길이 버그 수정 (채팅이 너무 길면 Chatgpt 3.5 터보로 처리 할 수 없습니다)
메모리 확장
충돌 보고서
기능을 개선하십시오

ChatGpt4를 기다리고 있습니다.

멀티 모달 입력 추가 (즉, "당신은 '이것'[이것 '[종이 비행기를 들고] 날 수 있다고 생각하십니까?" -> 카메라 -> chatgpt4-> "날개 끝을 향상시켜야합니다").
프로젝트 메모리 확장 이미지, PDF, 논문 ...

더 많은 통찰력은 프로젝트의 UpdateHistory.MD를 확인하십시오.

재미있게 보내세요!

오류 및 FAQ

카테고리 : 설치, 일반, 런타임

설치 : Venv_Requirements.txt를 설치하는 동안 상충되는 패키지가 있습니다. 어떻게해야합니까?

.venv (> Python- 가상 환경이 활성화 된 Version)에 올바른 Python 버전 (3.7)이 있는지 확인하십시오.
venv_requirements.txt 를 편집하고 중증 종속성의 버전 요구 사항을 제거하십시오.
TXT 파일에서 패키지를 직접 제거하고 나중에 수동으로 설치하십시오.

설치 : OpenAI_API_CHATBOT.py를 실행할 때 오류를 충족시킵니다.

문제는 Whisper와 관련이 있습니다. pip install whisper-openai 사용하여 수동으로 다시 설치해야합니다

설치 : 'OpenAi.Embeddings_utils'를 가져올 수 없습니다.

pip install --upgrade openai 로 사용하십시오.
이는 OpenAI가 최소 요구 사항을 높이기 때문에 발생합니다. 이 문제가 있었고 내부에 포함 된 embeddings_utils.py를 수동으로 다운로드하여 해결했습니다 ./<Your_venv>/lib/site-packages/openai/

3.```Datalib '' ''문제를 제기하고 누락 된 파일을 제공하겠습니다. 4. Python 3.8로 업그레이드하고 (새 환경 생성 및 Reinstall TT, 요구 사항).

설치 : 오류 ModulenotFoundError : '<Some Module>'이라는 모듈이 없습니다.

요구 사항은 모든 커밋을 업데이트하지 않습니다. 이로 인해 오류가 발생할 수 있지만 누락 된 모듈을 신속하게 설치할 수 있으며 동시에 새로운 패키지를 시도 할 때 환경이 충돌로부터 깨끗하게 유지됩니다 (그리고 많은 시도를 시도합니다).

RUN TIME : Whisper 모델을로드 할 때 약간의 메모리가 발생합니다. 무엇을 의미합니까?

그것은 당신이 선택한 모델이 Cuda 장치 메모리에 너무 큰 것을 의미합니다. 불행히도 더 작은 모델을로드하는 것 외에는 할 수있는 일이 많지 않습니다. 작은 모델이 당신을 만족시키지 못하면, 당신은 '명확한'말을하거나 더 긴 프롬프트를 만들어 모델이 당신이 말하는 것을보다 정확하게 예측하도록 할 수 있습니다. 이것은 불편하게 들리지만 제 경우에는 영어권을 크게 향상 시켰습니다 :)

런타임 : ChatGpt-3.5-Turbo의 최대 길이 토큰은 4096이지만 토큰을 받았습니다.

이것은 여전히 존재하는 버그이며, 어느 시점에서 전체 대화를 기억하기에 충분한 기억을 가질 것이기 때문에 조수와의 대화가 오래 걸릴 것으로 기대하지 않습니다. 수정이 개발 중이며 일부 개념을 반복 할 수 있어도 '슬라이딩 윈도우'접근 방식을 채택하는 것으로 구성 될 수 있습니다.

장군 : OpenAi 신용/데모를 마쳤습니다. 어떻게해야합니까?

온라인으로 만 이동하십시오. 가격은 그다지 나쁘지 않으며 가격이 사용량에 따라 달라지기 때문에 한 달에 몇 달러를 지불하게 될 수 있습니다 (심한 테스트에서는 무료 평가판 동안 한 달에 4 달러를 소비하게되었습니다). 월간 토큰 소비에 한도를 설정할 수 있습니다.
가장 신용 집약적 인 작업이 로컬로 무료로 실행되고 나머지는 온라인으로 수행되는 하이브리드 모드를 사용하십시오.
Vicuna를 설치하고 성능이 제한된 상태에서만 오프라인 모드를 실행하십시오.

일반 :이 프로젝트는 얼마나 오래 업데이트됩니까?

지금 (2023 년 4 월) 나는 이것에 대해 거의 논스톱으로 일하고 있습니다. 나는 논문을 작업하기 때문에 여름에 휴식을 취할 것입니다.

궁금한 점이 있으면 문제를 제기하여 저에게 연락 할 수 있으며 가능한 빨리 도움을 줄 수 있습니다.

Gianmarco Guarnier

확장하다

추가 정보

버전 1.0.0
유형 기타 소스코드
업데이트 시간 2025-03-03
크기 120.31MB
출처 Github

JARVIS ChatGPT