LLM Khusus Domain
Kompilasi Komprehensif LLM yang Disesuaikan untuk Domain dan Industri Tertentu
Konteks
- Model bahasa besar (LLM) telah merevolusi lanskap pemrosesan bahasa alami, menunjukkan kehebatan yang tak tertandingi dalam beragam tugas, mulai dari pembuatan teks sederhana hingga pemecahan masalah yang kompleks.
- Seiring dengan berkembangnya potensi LLM, terdapat peningkatan permintaan untuk menyesuaikan model ini untuk domain dan industri tertentu, memastikan bahwa basis pengetahuan mereka yang luas selaras dengan kebutuhan khusus.
- Repo ini bertujuan untuk membuat database LLM khusus domain yang dioptimalkan untuk berbagai sektor, mulai dari layanan kesehatan dan hukum hingga keuangan dan hiburan.
- Ini berupaya menjembatani kesenjangan antara LLM generik dan aplikasi khusus, menampilkan alat yang benar-benar memahami dan memenuhi nuansa linguistik unik dan tuntutan pengetahuan dari berbagai industri.
Isi
- Biologi
- Keuangan
- Kesehatan
- Teknologi Informasi
- Telekomunikasi
Biologi
Nama | Jenis | Keterangan | Demo | Kertas | Repo | Lokasi |
---|
ProtGPT2 | Terlatih sebelumnya | LLM (dengan 738 juta parameter) khusus untuk rekayasa dan desain protein dengan dilatih di ruang protein yang menghasilkan rangkaian protein de novo mengikuti prinsip-prinsip alami. | ? | - | - | ? |
Keuangan
Nama | Jenis | Keterangan | Demo | Kertas | Repo | Lokasi |
---|
BloombergGPT | Terlatih sebelumnya | 50 miliar parameter LLM dilatih pada berbagai data keuangan (363 miliar kumpulan data token) | - | ? | - | - |
FinChat | ? | Alat AI generatif untuk riset investasi, membantu mengurangi kebutuhan waktu untuk agregasi, visualisasi, dan ringkasan data. | ? | - | - | ? |
FinGPT | Diselesaikan dengan baik | Serangkaian LLM disesuaikan dengan model dasar (misalnya, Llama-2) dengan data keuangan terbuka | - | ? | ? | ? |
FinMA | Diselesaikan dengan baik | LLM finansial dari fine tuning LLaMa dengan data instruksi berbasis keuangan dengan 136 ribu sampel data | ? | ? | ? | - |
Tanya FT | ? | Alat LLM yang memungkinkan pengguna mengajukan pertanyaan apa pun dan menerima tanggapan menggunakan konten Financial Times (FT) yang diterbitkan selama dua dekade terakhir. | ? | ? | - | - |
Kesehatan
Nama | Jenis | Keterangan | Repo | Kertas | Demo | Lokasi |
---|
Med-PaLM | Diselesaikan dengan baik | LLM Google (disempurnakan menggunakan PaLM sebagai model dasar) dirancang untuk memberikan jawaban berkualitas tinggi atas pertanyaan medis. | - | ? | - | ? |
Med-PaLM 2 | Diselesaikan dengan baik | Versi Med-PaLM yang disempurnakan dirilis pada Maret 2023 oleh Google dengan peningkatan kinerja | ? | ? | ? | ? |
FarmasiGPT | Pembelajaran dalam konteks | Model GPT-4 dipadukan dengan pembelajaran dalam konteks (pendekatan dorongan dinamis) yang melibatkan data spesifik domain | - | ? | - | - |
RUSSELL-GPT | Diselesaikan dengan baik | LLM dikembangkan oleh National University Health System di Singapura untuk meningkatkan produktivitas dokter (misalnya, tanya jawab medis, ringkasan catatan kasus) | - | - | - | ? |
PH-LLM | Diselesaikan dengan baik | Personal Health Large Language Model (PH-LLM) adalah versi Gemini yang telah disempurnakan, dirancang untuk menghasilkan wawasan dan rekomendasi guna meningkatkan perilaku kesehatan pribadi terkait pola tidur dan kebugaran. | - | ? | - | ? |
Teknologi Informasi (TI)
Nama | Jenis | Keterangan | Repo | Kertas | Demo | Lokasi |
---|
BURUNG HANTU | Diselesaikan dengan baik | Model bahasa besar untuk operasi TI yang disesuaikan berdasarkan kumpulan data Owl-Instruct khusus dengan beragam informasi terkait TI | - | ? | - | - |
Telekomunikasi
Nama | Jenis | Keterangan | Repo | Kertas | Demo | Lokasi |
---|
TelecomGPT: Kerangka Kerja untuk Membangun Model Bahasa Besar Khusus Telekomunikasi | Diselesaikan dengan baik | LLM khusus telekomunikasi yang dapat digunakan untuk beberapa tugas hilir di domain telekomunikasi | - | ? | - | - |
Yang Harus Dilakukan