iOS GenAI سامبلر
مجموعة من أمثلة الذكاء الاصطناعي التوليدي على iOS.
الاستخدام
- أعد تسمية
APIKey.sample.swift
إلى APIKey.swift
، ثم ضع مفتاح OpenAI API في قيمة خاصية apiKeyOpenAI
. - بناء وتشغيل.
- يرجى التشغيل على جهاز iPhone أو iPad الخاص بك. (لا تعمل عينة الوقت الفعلي على أجهزة المحاكاة.)
محتويات
أمثلة GPT-4o متعددة الوسائط
دردشة نصية
مثال على الدردشة النصية الأساسية.
يُظهر كلا من التطبيقات العادية والمتدفقة.
فهم الصورة
مثال متعدد الوسائط يوفر وصفًا لصورة بواسطة GPT-4o.
عينة الإخراج
تُظهر الصورة شخصًا يجلس على طاولة ويحمل هاتفًا ذكيًا. ينظر الشخص إلى الهاتف ويبدو أنه يقوم بعملية تسجيل أو مشاهدة مقطع فيديو بنفسه على الجهاز. يرتدي الشخص سترة داكنة اللون عليها شعار "OpenAI". يوجد على الطاولة كوب أسود عليه شعار OpenAI. يوجد على الجانب الأيمن من الصورة منظر قريب لشاشة الهاتف يظهر فيه انعكاس الشخص.
يظهر الإعداد في الداخل، مع ظهور مصباح وكرسي في الخلفية. الإضاءة دافئة، مما يخلق جوًا مريحًا.
تلخيص الفيديو
مثال متعدد الوسائط يقدم ملخصًا لمقطع فيديو بواسطة GPT-4o.
عينة الإخراج
يظهر الفيديو كإطارات من عرض تقديمي من المحتمل أن يكون مرتبطًا بحدث Apple إلى WWDC21.- يُظهر الإطار الأول ثلاثة رموز تعبيرية متحركة لشخصيات M مضاءة جزئيًا.
- يعرض الإطار الثاني جهاز Apple MacBook بشعار WWDC21 وأربعة أيقونات تمثل تطبيقات مختلفة.
- تصور الإطارات التالية شخصًا، على الأرجح مقدمًا يقدم شرحًا. تشير البيئة إلى أنه عرض تقديمي يركز على التكنولوجيا، مع ظهور الكاميرات وأجهزة Mac في الخلفية.
- يوجد تراكب نص تدريجي يظهر بجوار موضوعات مقدم العرض بما في ذلك الحد الأدنى من التركيز مع "المسافة" و"فيديو HDR بدقة بت" و"التأثيرات في مركز التحكم في الفيديو 10" و"أفضل ممارسات الأداء" و"ضغط UrfaceIOS".
- يعرض الإطار الأخير شاشة سوداء تحتوي على النص "فئات التقاط AVFoundation".
تصور الإطارات بشكل جماعي مقطعًا من جلسة مطوري Apple، حيث تتم مناقشة التفاصيل الفنية وأفضل الممارسات المتعلقة بالتقاط الفيديو وتأثيراته.
فهم الفيديو في الوقت الحقيقي
مثال متعدد الوسائط يوفر وصفًا لمقطع فيديو في الوقت الفعلي بواسطة GPT-4o.
https://www.youtube.com/watch?v=bF5CW3b47Ss
أمثلة LLMs المحلية
فاي-3
مثال LLM محلي باستخدام Phi-3 - GGUF.
جيما
مثال LLM محلي باستخدام Gemma 2B Instruct - GGUF.
ميسترال 7 ب
مثال LLM محلي باستخدام Mistral-7B v0.1 - GGUF.
أمثلة على إطار ترجمة Apple
تراكب بسيط
ترجمة تراكب بسيطة مع تنفيذ سطر واحد.
ترجمة واجهة المستخدم المخصصة (متوفرة في فرع iOS 18)
مثال لترجمة واجهة المستخدم المخصصة باستخدام TranslationSession
.
توفر الترجمة (متوفر في فرع iOS 18)
عرض إمكانيات الترجمة لكل زوج لغوي باستخدام LanguageAvailability
.
أمثلة على الانتشار المستقر لـ ML
الانتشار المستقر v2.1
إنشاء الصور على الجهاز باستخدام الإصدار 2.1 من Stable Diffusion.
انتشار مستقر XL
إنشاء الصور على الجهاز باستخدام Stable Diffusion XL.
أمثلة الهمس
WhisperKit
التعرف على الكلام على الجهاز باستخدام WhisperKit.
### الميزات القادمة
- واجهات برمجة تطبيقات OpenAI الأخرى (مثل عمليات التضمين والصور والصوت وما إلى ذلك)
- LLMs المحلية
- نماذج الهمس الأخرى
- جوجل جيميني (iOS SDK)
- نماذج أخرى للانتشار المستقر
- iOS 18 / ذكاء ابل
- جينموجي
- أدوات الكتابة
- ملعب الصور