ดาวน์โหลด multimedia gpt - ดาวน์โหลด multimedia gpt ซอร์สโค้ด

multimedia gpt

ซอร์สโค้ดอื่น ๆ

1.0.0

ดาวน์โหลด

พื้นที่เก็บข้อมูลนี้ไม่ได้รับการดูแลอย่างแข็งขัน เนื่องจากมีโครงการขององค์กรล่าสุดที่มีวิสัยทัศน์เช่นเดียวกับเรา เช่น TaskMatrix, AutoGPT และ HuggingGPT ที่ได้รับประโยชน์จากความพยายามของทีมที่ใหญ่ขึ้นและการจัดการที่ดีขึ้น

มัลติมีเดียจีพีที

Multimedia GPT เชื่อมต่อ OpenAI GPT ของคุณกับภาพและเสียง ตอนนี้คุณสามารถส่งรูปภาพ ไฟล์บันทึกเสียง และเอกสาร PDF โดยใช้คีย์ OpenAI API ของคุณ และรับการตอบกลับทั้งในรูปแบบข้อความและรูปภาพ ขณะนี้เรากำลังเพิ่มการสนับสนุนสำหรับวิดีโอ ทั้งหมดนี้เกิดขึ้นได้ด้วยตัวจัดการพร้อมท์ที่ได้รับแรงบันดาลใจและสร้างขึ้นจาก Microsoft Visual ChatGPT

โมเดล

นอกเหนือจากโมเดลพื้นฐานการมองเห็นทั้งหมดที่กล่าวถึงใน Microsoft Visual ChatGPT แล้ว Multimedia GPT ยังรองรับ OpenAI Whisper และ OpenAI DAALLE! ซึ่งหมายความว่า คุณไม่จำเป็นต้องมี GPU ของคุณเองอีกต่อไปสำหรับการจดจำเสียงและสร้างภาพ (แม้ว่าคุณจะยังทำได้ก็ตาม!)

โมเดลการแชทพื้นฐานสามารถกำหนดค่าเป็น OpenAI LLM ใดก็ได้ รวมถึง ChatGPT และ GPT-4 เราตั้งค่าเริ่มต้นเป็น text-davinci-003

คุณสามารถแยกโปรเจ็กต์นี้และเพิ่มโมเดลที่เหมาะกับกรณีการใช้งานของคุณเองได้ วิธีง่ายๆ ในการทำเช่นนี้คือผ่าน llama_index คุณจะต้องสร้างคลาสใหม่สำหรับโมเดลของคุณใน model.py และเพิ่มเมธอดนักวิ่ง run_<model_name> ใน multimedia_gpt.py ดูตัวอย่าง run_pdf

สาธิต

ในการสาธิตนี้ ChatGPT จะถูกป้อนด้วยบันทึกของบุคคลที่บอกเล่าเรื่องราวของซินเดอเรลล่า

การติดตั้ง

 # Clone this repository
git clone https://github.com/fengyuli2002/multimedia-gpt
cd multimedia-gpt

# Prepare a conda environment
conda create -n multimedia-gpt python=3.8
conda activate multimedia-gptt
pip install -r requirements.txt

# prepare your private OpenAI key (for Linux / MacOS)
echo " export OPENAI_API_KEY='yourkey' " >> ~ /.zshrc
# prepare your private OpenAI key (for Windows)
setx OPENAI_API_KEY “ < yourkey > ”

# Start Multimedia GPT!
# You can specify the GPU/CPU assignment by "--load", the parameter indicates which foundation models to use and 
# where it will be loaded to. The model and device are separated by '_', different models are separated by ','.
# The available Visual Foundation Models can be found in models.py
# For example, if you want to load ImageCaptioning to cuda:0 and whisper to cpu 
# (whisper runs remotely, so it doesn't matter where it is loaded to)
# You can use: "ImageCaptioning_cuda:0,Whisper_cpu"

# Don't have GPUs? No worry, you can run DALLE and Whisper on cloud using your API key!
python multimedia_gpt.py --load ImageCaptioning_cpu,DALLE_cpu,Whisper_cpu       

# Additionally, you can configure the which OpenAI LLM to use by the "--llm" tag, such as 
python multimedia_gpt.py --llm text-davinci-003  
# The default is gpt-3.5-turbo (ChatGPT).

แผน

โปรเจ็กต์นี้เป็นงานทดลองและจะไม่นำไปใช้กับสภาพแวดล้อมการใช้งานจริง เป้าหมายของเราคือการสำรวจพลังแห่งการกระตุ้นเตือน

สิ่งที่ต้องทำ

รองรับ OpenAI Whisper สำหรับการรู้จำเสียง เพิ่มในการกำหนดค่าเริ่มต้น
รองรับ OpenAI DAALLE สำหรับการสร้างอิมเมจ เพิ่มในการกำหนดค่าเริ่มต้น
รองรับ OpenAI DAALLE สำหรับการแก้ไขภาพ
เพิ่มการสลับบรรทัดคำสั่งระหว่างแบ็กเอนด์ ChatGPT และ GPT-4
ใช้ฟังก์ชันที่แยกคีย์เฟรมออกจากวิดีโอ

ปัญหาที่ทราบ

DALLE ยอมรับเฉพาะรูปภาพ .png ที่เป็นสี่เหลี่ยมจัตุรัสเท่านั้น ซึ่งจำเป็นต้องได้รับการแก้ไข
PDFReader (จาก llama_index) ต้องการ langchain เวอร์ชันที่สูงกว่า ซึ่งเข้ากันไม่ได้กับวิธีการใช้งาน Visual ChatGPT

ผู้สนับสนุน

ขยาย

ข้อมูลเพิ่มเติม

เวอร์ชัน 1.0.0
ประเภท ซอร์สโค้ดอื่น ๆ
เวลาอัปเดต 2024-11-29
ขนาด 5.17MB
มาจาก Github

แอปที่เกี่ยวข้อง

GitHub sgrebnov/cordova plugin background download

2024-11-05
Wa ch ull navra maza navsacha 2 2024 ull ovie Fr e Online On Strea ings

2024-11-03
Wa ch navra maza navsacha 2 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-03
Wa ch the greatest of all time 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-02
wolfs 2024 f llmo ie f lmyz lla dow load ree 7 0p 4 0p a d 10 0p

2024-11-01
ภาพยนตร์และโทรทัศน์ GPT เวอร์ชันล่าสุด

2023-10-30

แนะนำสำหรับคุณ

chat.petals.dev

ซอร์สโค้ดอื่น ๆ

1.0.0
GPT Prompt Templates

ซอร์สโค้ดอื่น ๆ

1.0.0
GPTyped

ซอร์สโค้ดอื่น ๆ

GPTyped 1.0.5
waymo open dataset

ซอร์สโค้ดอื่น ๆ

December 2023 Update
SmartTube

ซอร์สโค้ดอื่น ๆ

24.71 Stable
Sunamu

ซอร์สโค้ดอื่น ๆ

Release 2.2.0
waymo open dataset

ซอร์สโค้ดอื่น ๆ

December 2023 Update
wp functions

หมวดหมู่อื่นๆ

1.0.0
termwind

หมวดหมู่อื่นๆ

v2.3.0

ข้อมูลที่เกี่ยวข้อง ทั้งหมด