สำหรับเวอร์ชันที่คล้ายกันสำหรับ SmartWatch Android ของคุณดูที่ repo repo gpt ตัวช่วยในการเชื่อมโยง โครงการนี้ใช้ประโยชน์จากผู้ช่วย API ของ Openai
(ทำเพื่อเครื่องยนต์ที่สมบูรณ์แบบเก่าและติดตั้งสำหรับ CHATGPT ไม่ดีเท่าสิ่งที่ทันสมัยดูต่อไป)
นี่คือบอทที่ช่วยให้คุณมีบทสนทนาที่พูดคุยกับการพูดคุยกับ CHATGPT หรือ GPT-4 ได้อย่างปลอดภัยโดยใช้ไมโครโฟนของคุณ หากคุณต้องการพิมพ์แทนที่จะพูดคุณยังสามารถสนทนากับบอทผ่านทางเทอร์มินัล
เครื่องมือนี้ใช้การตั้งค่าการแชท GPT ที่แก้ไขแล้วจัดการติดตามการสนทนาและใช้ API ของ CHATGPT ตามค่าเริ่มต้น คุณสามารถบอก GPT บางอย่างและมันจะจดจำสิ่งที่คุณพูดสำหรับเซสชั่นและคุณยังสามารถให้บอทพัฒนาความทรงจำของคุณเมื่อเวลาผ่านไปหากคุณต้องการ แม้จะมีข้อ จำกัด ตามจำนวนโทเค็นสูงสุดของ GPT แต่ GPT-VCC ก็ควรจะสามารถสนทนากับคุณได้ตราบใดที่คุณต้องการโดยไม่สูญเสียการรับรู้เกี่ยวกับสิ่งที่คุณพูดถึง ในการใช้เครื่องมือนี้คุณจะต้องใช้คีย์ OpenAI API ที่ถูกต้อง
บอทต้องการการกลั่นกรองและ GPT API ของ OpenAI เพื่อให้ทำงานได้อย่างถูกต้องโดยไม่ต้องแฝงมากเกินไป คุณสามารถค้นหาสถานะได้ที่นี่: https://status.openai.com/
การเผยแพร่ควรมีความเสถียรเท่าที่การทดสอบก่อนหน้านี้ไป แต่จะไม่มีคุณสมบัติใหม่ล่าสุดทั้งหมด หากคุณต้องการมีคุณสมบัติทั้งหมดตามที่ระบุไว้ที่นี่ให้โคลนที่เก็บและเรียกใช้ 'Git Pull' ทุกครั้งแล้ว สิ่งนี้จะทำให้คุณได้รับคุณสมบัติใหม่ล่าสุดและการแก้ไขข้อบกพร่องตามที่มา แต่อาจไม่เสถียร
(หมายเหตุ: Wisetech เป็นชื่ออินสแตนซ์บอทของฉันเลือกตัวเอง)
ก่อนอื่นคุณจะต้องใช้คีย์ OpenAI API คุณสามารถสร้างบัญชีเพื่อรับคีย์ API ได้ที่นี่: https://openai.com/api/
เมื่อคุณลงชื่อเข้าใช้แล้วกดวงกลมถัดจากข้อความ "ส่วนตัว" ที่มุมขวาบน จากนั้นกด "ดูคีย์ API"
กด "สร้างรหัสลับใหม่" จากนั้นบันทึกคีย์นั้น นั่นคือกุญแจสำคัญที่คุณจะต้องเรียกใช้ GPT-VCC วางไว้ในไฟล์คีย์ txt ที่รวมอยู่ในวิธีต่อไปนี้:
OpenAI_Key={paste here without brackets}
ไปที่แท็บ "การเรียกเก็บเงิน" ทางด้านซ้ายของหน้าจอ เริ่มแผนการชำระเงินเมื่อคุณไม่มีเครดิตฟรีเพื่อใช้ GPT-VCC
ดาวน์โหลด Python ที่ https://www.python.org/
ดาวน์โหลด repo นี้ผ่านการเผยแพร่ git clon repo หรือกดปุ่มรหัสไปทางขวาบนและกด "ดาวน์โหลด zip"
แยกเนื้อหาจากนั้นย้ายไปที่โฟลเดอร์ด้วยไฟล์
หากคุณติดตั้ง Windows Terminal ให้คลิกขวาที่ส่วนที่ว่างของโฟลเดอร์และเลือก 'Open in Terminal' มิฉะนั้นให้ใช้ Win + R และเข้าสู่ PowerShell เมื่อคุณอยู่ในหน้าต่างเทอร์มินัลและที่ไดเรกทอรีที่เหมาะสมให้ใช้ "PIP Install -r chendent.txt - -umgrade" หากสิ่งนี้ทำได้สำเร็จคุณควรพร้อมที่จะไปทันทีที่คุณได้รับคีย์ OpenAI API
ทำตามขั้นตอนที่ระบุไว้ในการใช้ GPT-VCC
ติดตั้ง pip3
sudo apt install python3-pip
ดาวน์โหลด repo นี้ผ่านการเผยแพร่ git clon repo หรือกดปุ่มรหัสไปทางขวาบนและกด "ดาวน์โหลด zip"
แยกไฟล์ย้ายไปยังไดเรกทอรี, open frequire.txt และลบ pyaudio == 0.2.13 จากไฟล์ ทำให้ดูเหมือนว่ามันไม่เคยอยู่ที่นั่นรักษารูปแบบดั้งเดิม
ดาวน์โหลด pyaudio ด้วย apt ดังนี้:
sudo apt install python3-pyaudio
ดาวน์โหลด espeak ด้วย apt ดังนี้ (จำเป็นสำหรับการสื่อสารอินเตอร์เฟส):
sudo apt install espeak
ดาวน์โหลดข้อกำหนดอื่น ๆ ด้วย PIP ดังนี้:
pip3 install -r requirements.txt --upgrade
ทำตามขั้นตอนที่ระบุไว้ในการใช้ GPT-VCC
หากต้องการใช้ chatbot นี้ให้ป้อนคำสั่งต่อไปนี้เมื่อคุณนำทางไปยังโฟลเดอร์ของบอท (แทนที่ <sey> ด้วยคีย์ API ของคุณ):
python main.py <key>
เพื่อความสะดวกคุณยังสามารถป้อนคีย์ลงในไฟล์ Keys.txt เมื่อคุณเรียกใช้สคริปต์บอทจะอ่านไฟล์นี้โดยอัตโนมัติและโหลดคีย์
Pygame GUI จะปรากฏขึ้น สีของมันแสดงถึงสถานะของบอท สีแดงบ่งบอกว่าบอทไม่ได้ฟัง ในการทำให้บอทฟังคุณให้กดพื้นที่ สีจะเปลี่ยนเป็นสีเหลืองเมื่อกำลังโหลดแล้วสีเขียวเมื่อฟัง พูดได้อย่างอิสระเมื่อสีเป็นสีเขียวคำพูดของคุณจะถูกบันทึกแปลงเป็นข้อความจากนั้นป้อนไปยัง GPT หากเป็นไปตามนโยบายของ OpenAI เมื่อ GPT พร้อมที่จะตอบกลับหน้าจอจะเปลี่ยนเป็นสีน้ำเงิน
หากคุณต้องการใช้เทอร์มินัลให้เรียกใช้ gptcli.py แทนการใช้ไวยากรณ์เดียวกัน (มี keyfile ยังใช้งานได้):
python gptcli.py <key>
หากคุณต้องการใช้ ElevenLabs TTS คุณต้องป้อนคีย์ Elevenlabs API ส่วนตัวของคุณตามคีย์ OpenAI API ของคุณดังนี้หรือกรอกข้อมูลในคีย์ในไฟล์คีย์:
python main.py <OpenAI key> <ElevenLabs TTS key>
หากคุณไม่ต้องการใช้ TTS แฟนซีบอทนี้จะใช้ TTS ของ Google โดยอัตโนมัติ
การกลั่นกรองใช้ทั้งเครื่องมือการกลั่นกรองของ OpenAI และ NLTK เมื่อรวมกันแล้วพวกเขาหวังว่าจะป้องกันการใช้ GPT ที่อยู่นอกนโยบายการใช้งานของ OpenAI นี่ไม่ใช่วิธีการที่ใช้งานได้ดังนั้นโปรดใช้ความระมัดระวังกับสิ่งที่คุณให้ GPT
โปรดทราบว่าปัญหาการหยุดทำงานหรือปัญหาแฝงกับ API การกลั่นกรองจะป้องกันไม่ให้คุณใช้ chatbot นี้ หากคุณต้องพูดคุยกับบอทในขณะที่ OpenAI กำลังมีปัญหาโปรดแก้ไขไฟล์ chatbot.py เพื่อยกเว้นเงื่อนไข "ไม่ใช่ self.flagged_by_openai (ข้อความ)" ฉันไม่แนะนำสิ่งนี้
ตอนนี้คุณสามารถใช้เสียงอื่นหากคุณต้องการใช้อาร์กิวเมนต์ที่ผ่านเมื่อเริ่มโปรแกรม ในอนาคตวิธีการทำเช่นนี้มีการวางแผน สำหรับตอนนี้คุณจะต้องรู้ ID ของเสียงที่คุณต้องการใช้ (คุณสามารถค้นหารายการของ ID เสียงพื้นฐานได้ที่นี่) เมื่อคุณรู้ว่า ID นั้นให้ใช้ดังนี้ด้วย ID ตัวอย่าง "21M00TCM4TLVDQ8IKWAM" สำหรับ RACHEL:
python main.py --voice_id 21m00Tcm4TlvDq8ikWAM
หากต้องการใช้เสียงโคลนให้ทำสิ่งต่อไปนี้:
ไปที่ห้องแล็บเสียงที่ https://beta.elevenlabs.io/voice-lab และสร้างเสียงที่กำหนดเอง
เมื่อคุณมีการโคลนเสียงแล้วไปที่นี่ https://api.elevenlabs.io/docs#/voices/get_voices_v1_voices_get
กด "ลองใช้" ป้อนคีย์ API ของคุณลงในกล่องจากนั้นกด "ดำเนินการ"
ด้านล่างปุ่มดำเนินการคุณจะเห็นกล่องที่มีป้ายกำกับว่า "ร่างกายตอบสนอง" เลื่อนลงในกล่องนี้จนกว่าคุณจะพบเสียงที่คุณตั้งชื่อ รับ "voice_id" ที่อยู่เหนือมันโดยตรงและใช้มันเหมือนในตัวอย่างข้างต้น
Spacebar : สิ่งนี้เริ่มต้นและหยุดการบันทึก สิ่งที่คุณพูดจะถูกถอดความและส่งไปยัง GPT (ถ้าผ่านตัวกรอง) เมื่อคุณกดพื้นที่เป็นครั้งที่สอง
Escape : ทางออกนี้โดยไม่ต้องจดจำ
ถาม : การเลิกนี้และมีบอทจดจำรายละเอียดเกี่ยวกับคุณและการสนทนาของคุณ (ข้อมูลถูกบันทึกไว้ในไฟล์ข้อความที่เรียกว่า memories.txt)
P : นี่คือคำสั่งค่าเสื่อมราคาเพื่อยกเลิกข้อความ ตอนนี้เพียงแค่พูดว่า "โปรดยกเลิกข้อความ" ในขณะที่บันทึกเพื่อยกเลิก
พูดว่า 'โปรดตั้งค่าโทเค็นเป็น #' : เมื่อบอทรับรู้วลีนี้มันจะพยายามตั้งค่า max_tokens ของการตอบกลับค่าที่คุณระบุ
พูดว่า 'พูดเหมือนหุ่นยนต์' : สิ่งนี้จะกำหนดคำตอบทั้งหมดจาก GPT ที่จะพูดกับโปรแกรม TTS หุ่นยนต์ที่ทำงานแบบออฟไลน์ ในโหมด CLI ให้ป้อน '! Robospeak ()' เพื่อสลับโหมดนี้
พูดว่า 'หยุดพูดเหมือนหุ่นยนต์' : สิ่งนี้จะเปลี่ยน TTS ของบอทไปสู่สิ่งที่คุณเคยมีมาก่อน (ไม่ว่าจะเป็น Google หรือสิบเอ็ด TTS) ในโหมด CLI ให้ป้อน '! Robospeak ()' เพื่อสลับโหมดนี้
พูดว่า 'โปรดแสดงการสนทนา' : สิ่งนี้จะส่งผลการสนทนาทั้งหมดของคุณไปที่หน้าต่างเทอร์มินัล
พูดว่า 'โปรดแสดงความทรงจำ' : สิ่งนี้จะให้ผลลัพธ์ของความทรงจำทั้งหมดที่บันทึกไว้ในที่เก็บข้อมูลระยะยาว
พูดว่า 'โปรดกู้คืนหน่วยความจำ' : สิ่งนี้จะพยายามซ่อมแซมหน่วยความจำที่ทำงานของบอทโดยการรวมความทรงจำจำนวนหนึ่งจากการจัดเก็บระยะยาว
พูดว่า 'โปรดตั้งค่าล่วงหน้าเป็น' : สิ่งนี้จะตั้งค่าที่ตั้งไว้ล่วงหน้า (สตริงข้อความที่มอบให้กับ AI เมื่อเริ่มต้นการสนทนาทุกครั้ง) สำหรับบอท ตัวอย่างเช่นที่ตั้งไว้ล่วงหน้า 'พูดเหมือนโจรสลัด' ทำให้ AI พูดเหมือนโจรสลัด คุณสามารถค้นหาตัวอย่างที่ตั้งไว้ล่วงหน้าได้ที่นี่: https://github.com/adri6336/gpt-voice-conversation-chatbot/wiki/example-presets
พูดว่า 'โปรดรีเซ็ตล่วงหน้า' : สิ่งนี้จะลบที่ตั้งไว้ล่วงหน้าที่คุณทำ
พูดว่า 'โปรดตั้งชื่อเป็น' : นี่จะตั้งชื่อของบอทเป็นสิ่งที่คุณระบุตราบใดที่มันเป็นไปตามนโยบายการใช้งานของ OpenAI หลังจากตั้งค่าชื่อบอทจะอ้างถึงตัวเองด้วยชื่อที่คุณตั้งไว้
พูดว่า 'โปรดสลับ GPT4' : สิ่งนี้จะสลับระหว่างรุ่น CHATGPT และ GPT-4 เมื่อเริ่มต้นสวิตช์ของคุณจะถูกเก็บรักษาไว้ ในโหมด CLI ให้ป้อน '! gpt4 ()' เพื่อสลับโมเดล
พูดว่า 'โปรดตั้งค่าความคิดสร้างสรรค์' : สิ่งนี้จะตั้งค่าการสุ่มเริ่มต้นของบอทเป็นค่าที่คุณระบุระหว่าง 1 ถึง 15 (เคยเป็น 9) ในโหมด CLI ให้ใช้ '! ความคิดสร้างสรรค์ ( #)' โดยที่เครื่องหมาย # เป็นค่าระหว่าง 0.01 ถึง 1.5
พูดว่า 'โปรดแสดงรายการคำสั่ง' : นี่จะมีรายการบอทออกคำสั่งที่มีอยู่สำหรับคุณ
พูดว่า 'โปรดสลับ Elevenlabs' : สิ่งนี้จะสลับการใช้บอทของสิบเอ็ด TTS เปิดและปิด ในโหมด CLI ใช้! 11ai () เพื่อสลับมัน
พูดว่า 'โปรดยกเลิกข้อความ' : สิ่งนี้จะยกเลิกข้อความป้องกันไม่ให้ถูกส่งไปยัง GPT
มีการสนทนาส่วนตัวกับ CHATGPT หรือ GPT-4
ฟัง GPT พูดคุยกับคุณด้วยเครื่องมือ TTS ของ Google (จะออกเสียงเน้นเสียงอย่างถูกต้องถ้าทำได้) ใน TTS เหมือนชีวิตของ Elevenlab (ถ้าคุณมีคีย์ API ที่ถูกต้อง) หรือเป็นหุ่นยนต์ (พูดว่า "พูดเหมือนหุ่นยนต์" เพื่อเปิดใช้งาน)
พูดคุยกับ GPT Outloud โดยใช้เทคโนโลยีการจดจำคำพูดของ Google
บอทจะจดจำสิ่งต่าง ๆ เกี่ยวกับคุณหากคุณปิดด้วยปุ่ม 'Q'
ดูคำตอบของ GPT เป็นข้อความในหน้าต่างเทอร์มินัล อักขระ UTF-32 ส่วนใหญ่ (เช่นข้อความภาษาจีนและภาษาอาหรับ) จะถูกพิมพ์ด้วย
บันทึกการสนทนาลงในไฟล์บนดิสก์ของคุณโดยอัตโนมัติเพื่อช่วยให้คุณติดตามสิ่งที่คุณพูดถึง
บันทึกที่กำหนดเองที่กำหนดเองเพื่อให้ได้รับประสบการณ์ที่เหมาะกว่าสำหรับคุณและความต้องการของคุณ
ปรับแต่งชื่อบอท
ปรับแต่งความคิดสร้างสรรค์ของบอท
แชทกับ GPT ผ่านเทอร์มินัล (Windows และ Linux)
สนทนากับบอทสันทนาการ
ใช้บอทเพื่อฝึกฝนภาษาโดยการตั้งค่าล่วงหน้าเพื่อพูดคุยกับคุณในภาษานั้นเหมือนครูและได้ยินคำตอบด้วยการออกเสียงที่เหมาะสมโดยใช้ TTS ของ Google หากคุณต้องการคุณสามารถติดกับเสียงหลายภาษาของ Elevenlabs
มีบอทช่วยคุณฝึกการเขียนโปรแกรมโดยถามคำถามและให้ข้อเสนอแนะเกี่ยวกับรหัสของคุณ
ถามคำถามบอทเกี่ยวกับสิ่งต่าง ๆ ที่ปรากฏขึ้น
ขอให้บอทช่วยคุณเขียนจดหมายปกและคำอธิบาย
การสาธิตเสียงสิบเอ็ดคน
การสาธิตเสียงภาษาสเปนของ Google TTS