تنزيل multimedia gpt - تنزيل كود مصدر multimedia gpt

multimedia gpt

شفرة المصدر الأخرى

1.0.0

تنزيل

لا تتم صيانة هذا المستودع بشكل نشط نظرًا لوجود مشاريع مؤسسية حديثة تشترك في رؤيتنا، مثل TaskMatrix، وAutoGPT، وHuggingGPT، والتي تستفيد من جهد فريق أكبر وإدارة أفضل.

الوسائط المتعددة جي بي تي

تعمل الوسائط المتعددة GPT على توصيل OpenAI GPT الخاص بك بالرؤية والصوت. يمكنك الآن إرسال الصور والتسجيلات الصوتية ومستندات pdf باستخدام مفتاح OpenAI API الخاص بك، والحصول على رد بتنسيقي النص والصور. نقوم حاليًا بإضافة دعم لمقاطع الفيديو. أصبح كل ذلك ممكنًا بفضل مدير سريع مستوحى ومبني على Microsoft Visual ChatGPT.

نماذج

بالإضافة إلى جميع نماذج أساس الرؤية المذكورة في Microsoft Visual ChatGPT، يدعم Multimedia GPT OpenAI Whisper وOpenAI DALLE! هذا يعني أنك لم تعد بحاجة إلى وحدات معالجة الرسومات الخاصة بك للتعرف على الصوت وإنشاء الصور (على الرغم من أنه لا يزال بإمكانك ذلك!)

يمكن تكوين نموذج الدردشة الأساسي كأي نموذج OpenAI LLM ، بما في ذلك ChatGPT وGPT-4. نحن الافتراضيون على text-davinci-003 .

نرحب بتقسيم هذا المشروع وإضافة نماذج مناسبة لحالة الاستخدام الخاصة بك. هناك طريقة بسيطة للقيام بذلك وهي من خلال llama_index. سيكون عليك إنشاء فئة جديدة لنموذجك في model.py ، وإضافة طريقة تشغيل run_<model_name> في multimedia_gpt.py . راجع run_pdf للحصول على مثال.

تجريبي

في هذا العرض التوضيحي، يتم تغذية ChatGPT بتسجيل لشخص يروي قصة سندريلا.

تثبيت

 # Clone this repository
git clone https://github.com/fengyuli2002/multimedia-gpt
cd multimedia-gpt

# Prepare a conda environment
conda create -n multimedia-gpt python=3.8
conda activate multimedia-gptt
pip install -r requirements.txt

# prepare your private OpenAI key (for Linux / MacOS)
echo " export OPENAI_API_KEY='yourkey' " >> ~ /.zshrc
# prepare your private OpenAI key (for Windows)
setx OPENAI_API_KEY “ < yourkey > ”

# Start Multimedia GPT!
# You can specify the GPU/CPU assignment by "--load", the parameter indicates which foundation models to use and 
# where it will be loaded to. The model and device are separated by '_', different models are separated by ','.
# The available Visual Foundation Models can be found in models.py
# For example, if you want to load ImageCaptioning to cuda:0 and whisper to cpu 
# (whisper runs remotely, so it doesn't matter where it is loaded to)
# You can use: "ImageCaptioning_cuda:0,Whisper_cpu"

# Don't have GPUs? No worry, you can run DALLE and Whisper on cloud using your API key!
python multimedia_gpt.py --load ImageCaptioning_cpu,DALLE_cpu,Whisper_cpu       

# Additionally, you can configure the which OpenAI LLM to use by the "--llm" tag, such as 
python multimedia_gpt.py --llm text-davinci-003  
# The default is gpt-3.5-turbo (ChatGPT).

الخطط

هذا المشروع هو عمل تجريبي ولن يتم نشره في بيئة الإنتاج. هدفنا هو استكشاف قوة التحفيز.

المهام

دعم OpenAI Whisper للتعرف على الكلام، تمت إضافته إلى التكوين الافتراضي
دعم OpenAI DALE لتوليد الصور، تمت إضافته إلى التكوين الافتراضي
دعم OpenAI DALE لتحرير الصور
أضف مفتاح تبديل سطر الأوامر بين الواجهات الخلفية لـ ChatGPT وGPT-4
تنفيذ وظيفة تستخرج الإطارات الرئيسية من الفيديو

المشاكل المعروفة

يقبل DALLE فقط الصور المربعة بتنسيق png - ويحتاج إلى حل بديل
يتطلب PDFReader (من llama_index) إصدارًا أعلى من langchain، وهو غير متوافق مع كيفية تنفيذ chatGPT المرئي

أنصار

يوسع

معلومات إضافية

الإصدار 1.0.0
النوع شفرة المصدر الأخرى
وقت التحديث 2024-11-29
الحجم 5.17MB
من Github

تطبيقات ذات صلة

GitHub sgrebnov/cordova plugin background download

2024-11-05
Wa ch ull navra maza navsacha 2 2024 ull ovie Fr e Online On Strea ings

2024-11-03
Wa ch navra maza navsacha 2 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-03
Wa ch the greatest of all time 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-02
wolfs 2024 f llmo ie f lmyz lla dow load ree 7 0p 4 0p a d 10 0p

2024-11-01
أحدث نسخة من GPT للسينما والتلفزيون

2023-10-30

نوصي لك

chat.petals.dev

شفرة المصدر الأخرى

1.0.0
GPT Prompt Templates

شفرة المصدر الأخرى

1.0.0
GPTyped

شفرة المصدر الأخرى

GPTyped 1.0.5
waymo open dataset

شفرة المصدر الأخرى

December 2023 Update
SmartTube

شفرة المصدر الأخرى

24.71 Stable
Sunamu

شفرة المصدر الأخرى

Release 2.2.0
waymo open dataset

شفرة المصدر الأخرى

December 2023 Update
wp functions

فئات أخرى

1.0.0
termwind

فئات أخرى

v2.3.0

أخبار ذات صلة الكل