Pengambil Sampel GenAI iOS
Kumpulan contoh AI Generatif di iOS.
Penggunaan
- Ganti nama
APIKey.sample.swift
menjadi APIKey.swift
, dan masukkan Kunci API OpenAI Anda ke dalam nilai properti apiKeyOpenAI
. - Bangun dan jalankan.
- Silakan jalankan di iPhone atau iPad Anda. (Contoh waktu nyata tidak berfungsi pada simulator.)
Isi
Contoh Multimoda GPT-4o
Obrolan teks
Contoh obrolan teks dasar.
Ini menunjukkan implementasi normal dan streaming.
Pemahaman gambar
Contoh multimodal yang memberikan deskripsi gambar dengan GPT-4o.
Sampel keluaran
Gambar tersebut memperlihatkan seseorang yang sedang duduk di meja sambil memegang smartphone. Orang tersebut sedang melihat telepon dan tampaknya sedang dalam proses merekam atau melihat video sendiri di perangkat. Orang tersebut mengenakan hoodie berwarna gelap dengan logo "OpenAI" di atasnya. Di atas meja terdapat mug hitam dengan logo OpenAI di atasnya. Di sebelah kanan gambar terdapat tampilan close-up layar ponsel yang memperlihatkan pantulan orang tersebut.
Latarnya tampak di dalam ruangan, dengan lampu dan kursi terlihat di latar belakang. Pencahayaannya hangat, menciptakan suasana nyaman.
Ringkasan video
Contoh multimodal yang memberikan ringkasan video dengan GPT-4o.
Sampel keluaran
Video tersebut menampilkan bingkai dari sebuah presentasi yang kemungkinan besar terkait dengan acara Apple dengan WWDC21.- Bingkai pertama menunjukkan tiga emoji karakter M animasi yang menyala sebagian.
- Bingkai kedua menampilkan Apple MacBook dengan logo WWDC21 dan empat ikon yang mewakili aplikasi berbeda.
- Bingkai berikut menggambarkan orang a, kemungkinan besar adalah presenter yang memberikan penjelasan. Lingkungan menunjukkan bahwa ini adalah presentasi yang berfokus pada teknologi, dengan kamera dan Mac terlihat di latar belakang.
- Ada hamparan teks bertahap yang muncul di sebelah topik penyaji termasuk Fokus minimum dengan "jarak", "video HDR -bit", "Efek di Pusat Kontrol Video10", "Praktik terbaik kinerja", dan "kompresi permukaan IOS".
- Bingkai terakhir menunjukkan layar hitam dengan teks "AV captureFoundation class."
Bingkai tersebut secara kolektif menggambarkan segmen dari sesi pengembang Apple, yang membahas detail teknis dan praktik terbaik terkait pengambilan dan efek video.
Pemahaman video waktu nyata
Contoh multimodal yang memberikan deskripsi video secara realtime dengan GPT-4o.
https://www.youtube.com/watch?v=bF5CW3b47Ss
Contoh LLM Lokal
Fi-3
Contoh LLM lokal menggunakan Phi-3 - GGUF.
permata
Contoh LLM lokal menggunakan Gemma 2B Instruct - GGUF.
Mistral 7B
Contoh LLM lokal menggunakan Mistral-7B v0.1 - GGUF.
Contoh Kerangka Terjemahan Apple
Hamparan Sederhana
Terjemahan overlay sederhana dengan implementasi 1 baris.
Terjemahan UI Khusus (Tersedia di cabang iOS 18)
Contoh terjemahan UI khusus menggunakan TranslationSession
.
Ketersediaan Terjemahan (Tersedia di cabang iOS 18)
Menampilkan ketersediaan terjemahan untuk setiap pasangan bahasa menggunakan LanguageAvailability
.
Contoh Difusi Stabil Core ML
Difusi Stabil v2.1
Pembuatan Gambar Pada Perangkat menggunakan Difusi Stabil v2.1.
Difusi Stabil XL
Pembuatan Gambar Pada Perangkat menggunakan Stable Diffusion XL.
Contoh Bisikan
Kit Bisikan
Pengenalan Ucapan Pada Perangkat menggunakan WhisperKit.
### Fitur Mendatang
- OpenAI API lainnya (misalnya Embeddings, Gambar, Audio, dll.)
- LLM lokal
- Model Bisikan lainnya
- Google Gemini (SDK iOS)
- Model Difusi Stabil lainnya
- iOS 18 / Intelijen Apple
- Genmoji
- Alat Tulis
- Taman Bermain Gambar