databricks llm prompt engineering
1.0.0
Pada 29/08/2023, Anda akan menemukan contoh -contoh berikut di folder notebooks
:
?? ♂️ customer_service
Artefak | Keterangan |
---|---|
hf_mlflow_crash_course | ? Memberikan contoh dasar menggunakan wajah pelukan untuk melatih model klasifikasi niat menggunakan distilbert-qa . Juga menampilkan konsep dasar MLFLOW, seperti pelacakan eksperimen, penebangan artefak dan pendaftaran model. |
primer | ? Sebagian besar notebook konseptual. Berisi penjelasan seputar rekayasa cepat, dan konsep dasar seperti pengambilan sampel K atas , pengambilan sampel P atas dan suhu . |
basic_prompt_evaluation | ? Mendemonstrasikan Engineeering Prompt Dasar dengan model LLM ringan. Selain itu, menampilkan fitur LLM terbaru MLFLOW, seperti mlflow.evaluate() . |
few_shot_learning | ? Di sini kami mengeksplorasi beberapa pembelajaran bidikan dengan LLM berbasis instruksi (MPT-7B-instruct). |
active_prompting | ?? ♂️ Dalam buku catatan ini, kami mengeksplorasi teknik -teknik pendakian aktif. Selain itu, kami menunjukkan cara memanfaatkan VLLM untuk mencapai peningkatan latensi inferensi 7x - 10x. |
llama2_mlflow_logging_inference | Di sini kami menunjukkan cara mencatat, mendaftar, dan menggunakan model Llama V2 ke dalam MLFLOW |
mpt_mlflow_logging_inference | Di sini kami menunjukkan cara mencatat, mendaftar, dan menggunakan model MPT-instruct ke MLFLOW. Berbeda dari contoh LLAMA V2, di sini kita memuat bobot model langsung ke model yang melayani titik akhir ketika titik akhir diinisialisasi, tanpa mengunggah artefak ke dalam MLFLOW Model Registry. |
frontend | ? Contoh ujung ke ujung dari aplikasi demo frontend yang terhubung ke salah satu model yang melayani titik akhir yang digunakan di buku catatan sebelumnya menggunakan gradio |
Untuk mulai menggunakan repo ini di databricks, ada beberapa pra-persyaratan:
/Repos/[email protected]/databricks-llm-prompt-engineering/init/init.sh
accelerate==0.21.0
einops==0.6.1
flash-attn==v1.0.5
ninja
tokenizers==0.13.3
transformers==4.30.2
xformers==0.0.20
? Aplikasi Web Frontend Menggunakan Gradio Penyebaran model dan inferensi waktu nyata
? Retrieval Augmented Generation (RAG)
? ️ Mlflow AI Gateway