Microsoft baru-baru ini merilis tiga model AI Phi-3.5 yang kuat, yaitu Phi-3.5-mini-instruct, Phi-3.5-MoE-instruct, dan Phi-3.5-vision-instruct, yang masing-masing menargetkan model penalaran ringan dan tugas multi-modal dioptimalkan. Hal ini menandai kemajuan signifikan Microsoft di bidang kecerdasan buatan multibahasa dan multimodal, yang semakin memantapkan posisi terdepannya di bidang ini. Ketiga model tersebut dirilis di bawah lisensi sumber terbuka MIT, memberikan pengembang berbagai kemungkinan aplikasi.
Microsoft mengumumkan peluncuran tiga model Phi-3.5 baru, yang semakin mengkonsolidasikan posisi terdepannya dalam pengembangan kecerdasan buatan multi-bahasa dan multi-modal. Tiga model baru tersebut adalah: Phi-3.5-mini-instruct, -3.5-MoE-instruct dan Phi-3.5-vision-instruct, masing-masing menargetkan skenario aplikasi yang berbeda.
Model Phi-3.5Mini Instruct adalah model AI ringan dengan 380 juta parameter, yang sangat cocok untuk lingkungan dengan daya komputasi terbatas. Ini mendukung panjang konteks 128k dan secara khusus dioptimalkan untuk kemampuan eksekusi instruksi, sehingga cocok untuk tugas-tugas seperti pembuatan kode, pemecahan masalah matematika, dan penalaran logis. Meskipun ukurannya kecil, model ini menunjukkan daya saing yang mengesankan dalam tugas dialog multi-bahasa dan multi-putaran, melampaui model lain di kelasnya.
Pintu masuk: https://huggingface.co/microsoft/Phi-3.5-mini-instruct
Model Phi-3.5MoE, model “ahli hybrid”, menggabungkan beberapa jenis model yang berbeda, masing-masing berfokus pada tugas tertentu. Ini memiliki 41,9 miliar parameter dan mendukung panjang konteks 128k, yang dapat menunjukkan kinerja yang kuat dalam berbagai tugas penalaran. Model ini berkinerja sangat baik dalam kode, matematika, dan pemahaman multi-bahasa, bahkan melampaui model yang lebih besar dalam beberapa tolok ukur, seperti melampaui GPT-4o OpenAI dalam MMLU (Massive Multi-Task Language Understanding) mini.
Pintu masuk: https://huggingface.co/microsoft/Phi-3.5-MoE-instruct
Model Phi-3.5Vision Instruct adalah model AI multi-modal canggih yang mengintegrasikan kemampuan pemrosesan teks dan gambar dan cocok untuk tugas-tugas seperti pemahaman gambar, pengenalan karakter optik, analisis bagan dan tabel, serta ringkasan video. Model ini juga mendukung panjang konteks 128k dan dapat menangani tugas visi multi-frame yang kompleks.
Pintu masuk: https://huggingface.co/microsoft/Phi-3.5-vision-instruct
Untuk melatih ketiga model ini, Microsoft melakukan pemrosesan data skala besar. Model Mini Instruct menggunakan 3,4 triliun penanda dan dilatih pada 512 GPU H100-80G selama 10 hari; model Vision Instruct menggunakan 500 miliar penanda dan dilatih dalam 6 hari; dan model MoE digunakan dalam 23 hari, 4,9 triliun penanda digunakan untuk pelatihan.
Perlu disebutkan bahwa ketiga model Phi-3.5 ini semuanya dirilis di bawah lisensi sumber terbuka MIT, dan pengembang dapat dengan bebas menggunakan, memodifikasi, dan mendistribusikan perangkat lunak ini. Hal ini tidak hanya mencerminkan dukungan Microsoft terhadap komunitas open source, namun juga memungkinkan lebih banyak pengembang untuk mengintegrasikan kemampuan AI mutakhir ke dalam aplikasi mereka.
Menyorot:
Microsoft meluncurkan tiga model AI baru, yang menargetkan penalaran ringan, pakar hybrid, dan tugas multi-modal.
?Phi-3.5MoE mengungguli GPT-4o mini dalam pengujian benchmark dan berkinerja baik.
? Ketiga model tersebut dilisensikan di bawah lisensi sumber terbuka MIT, dan pengembang dapat dengan bebas menggunakan dan memodifikasinya.
Secara keseluruhan, ketiga model Phi-3.5 yang dirilis oleh Microsoft, dengan kinerjanya yang kuat, skenario aplikasi yang luas, dan lisensi terbuka, tidak diragukan lagi akan memiliki dampak besar pada bidang kecerdasan buatan dan menyediakan alat yang canggih bagi pengembang dan peneliti juga menandai arah baru pengembangan teknologi AI di masa depan.