Penting
Repositori ini sudah tidak digunakan lagi dan hanya dimaksudkan untuk meluncurkan proyek Instill Core hingga versi v0.12.0-beta
, dengan versi Instill Model sesuai dengan v0.9.0-alpha
di repositori yang tidak digunakan lagi ini. Periksa proyek Instill Core terbaru di repositori instill-ai/instill-core.
⚗️ Instill Model , atau sederhananya Model , merupakan komponen integral dari proyek Instill Core. Ini berfungsi sebagai platform ModelOps/LLMOps canggih yang berfokus pada pemberdayaan pengguna untuk mengimpor, menyajikan, menyempurnakan, dan memantau model Machine Learning (ML) dengan lancar untuk pengoptimalan berkelanjutan.
macOS atau Linux - Instill Model berfungsi di macOS atau Linux, tetapi belum mendukung Windows.
Docker dan Docker Compose - Instill Model menggunakan Docker Compose (khususnya, spesifikasi Compose V2
dan Compose specification
) untuk menjalankan semua layanan di lokal. Silakan instal Docker dan Docker Compose terbaru sebelum menggunakan Instill Model.
yq
> v4.x
. Silakan ikuti panduan instalasi.
(Opsional) NVIDIA Container Toolkit - Untuk mengaktifkan dukungan GPU di Instill Model, silakan merujuk ke Dokumentasi Asli NVIDIA Cloud untuk menginstal NVIDIA Container Toolkit. Jika Anda ingin secara khusus mengalokasikan GPU ke Instill Model, Anda dapat mengatur variabel lingkungan NVIDIA_VISIBLE_DEVICES
. Misalnya, NVIDIA_VISIBLE_DEVICES=0,1
akan membuat triton-server
menggunakan id perangkat GPU 0
dan 1
secara khusus. Secara default NVIDIA_VISIBLE_DEVICES
disetel ke all
untuk menggunakan semua GPU yang tersedia di mesin.
Catatan Gambar model-backend (~2GB) dan Triton Inference Server (~23GB) memerlukan waktu beberapa saat untuk ditarik, namun ini harus dilakukan satu kali saja pada pengaturan pertama.
Gunakan versi rilis stabil
Jalankan perintah berikut untuk menarik image yang sudah dibuat sebelumnya dengan semua dependensi yang akan diluncurkan:
$ git clone -b v0.10.0-alpha https://github.com/instill-ai/deprecated-model.git && cd deprecated-model
# Launch all services
$ make all
Itu saja! Setelah semua layanan memiliki status kesehatan, UI siap digunakan di http://localhost:3000. Silakan temukan kredensial login default di dokumentasi.
Untuk mematikan semua layanan yang sedang berjalan:
$ make down
Jelajahi dokumentasi untuk menemukan semua opsi penerapan yang tersedia.
Kami menyusun daftar model siap pakai. Model terlatih ini berasal dari berbagai sumber dan telah dilatih serta diterapkan oleh tim kami. Ingin menyumbangkan model baru? Silakan buat masalah, dengan senang hati kami menambahkannya ke daftar?.
Model | Tugas | Sumber | Kerangka | CPU | GPU |
---|---|---|---|---|---|
MobileNet v2 | Klasifikasi Gambar | GitHub-DVC | ONNX | ✅ | ✅ |
Transformator Penglihatan (ViT) | Klasifikasi Gambar | Memeluk Wajah | ONNX | ✅ | |
YOLOv4 | Deteksi Objek | GitHub-DVC | ONNX | ✅ | ✅ |
YOLOv7 | Deteksi Objek | GitHub-DVC | ONNX | ✅ | ✅ |
Pose YOLOv7 W6 | Deteksi Titik Kunci | GitHub-DVC | ONNX | ✅ | ✅ |
PSNet + EasyOCR | Pengenalan Karakter Optik (OCR) | GitHub-DVC | ONNX | ✅ | ✅ |
Topeng RCNN | Segmentasi Instance | GitHub-DVC | PyTorch | ✅ | ✅ |
Lite R-ASPP berdasarkan MobileNetV3 | Segmentasi Semantik | GitHub-DVC | ONNX | ✅ | ✅ |
Difusi Stabil | Teks ke Gambar | GitHub-DVC, CPU Lokal, GPU Lokal | ONNX | ✅ | ✅ |
Difusi Stabil XL | Teks ke Gambar | GitHub-DVC | PyTorch | ✅ | |
Kontrol Bersih - Cerdik | Gambar ke Gambar | GitHub-DVC | PyTorch | ✅ | |
Megatron GPT2 | Pembuatan Teks | GitHub-DVC | Transformator Lebih Cepat | ✅ | |
Lama2 | Pembuatan Teks | GitHub-DVC | vLLM, PyTorch | ✅ | ✅ |
Kode Llama | Pembuatan Teks | GitHub-DVC | vLLM | ✅ | |
Obrolan Llama2 | Obrolan Pembuatan Teks | GitHub-DVC | vLLM | ✅ | |
MosaikML MPT | Obrolan Pembuatan Teks | GitHub-DVC | vLLM | ✅ | |
Mistral | Obrolan Pembuatan Teks | GitHub-DVC | vLLM | ✅ | |
Zephyr-7b | Obrolan Pembuatan Teks | GitHub-DVC | PyTorch | ✅ | ✅ |
Llava | Menjawab Pertanyaan Visual | GitHub-DVC | PyTorch | ✅ |
Catatan: Sumber GitHub-DVC
dalam tabel berarti mengimpor model ke Instill Model dari repositori GitHub yang menggunakan DVC untuk mengelola file besar.
Lihat file LISENSI untuk informasi lisensi.