databricks llm prompt engineering
1.0.0
29/08/2023の時点で、 notebooks
フォルダーに次の例があります。
customer_service
アーチファクト | 説明 |
---|---|
hf_mlflow_crash_course | ? distilbert-qa を使用して、意図分類モデルをトレーニングするために、ハグを使用した顔を使用した基本的な例を提供します。また、実験追跡、アーティファクトロギング、モデル登録など、MLFLOWの基本的な概念も紹介します。 |
primer | ?主に概念的ノートブック。迅速なエンジニアリングに関する説明、およびトップKサンプリング、トップPサンプリング、温度などの基本的な概念が含まれています。 |
basic_prompt_evaluation | ?軽量LLMモデルを使用した基本的なプロンプトエンジンを実証します。これに加えて、 mlflow.evaluate() などのMLFLOWの最新のLLM機能を紹介します。 |
few_shot_learning | ?ここでは、命令ベースのLLM(MPT-7B-Instruct)を使用したショットラーニングをほとんど探ります。 |
active_prompting | このノートブックでは、アクティブなプロンプトテクニックを探ります。さらに、7倍から10倍の推論レイテンシの改善を達成するために、VLLMを活用する方法を示します。 |
llama2_mlflow_logging_inference | ここでは、llama v2モデルをmlflowに記録、登録、展開する方法を示します |
mpt_mlflow_logging_inference | ここでは、MPT-InstructモデルをMLFLOWにログインし、登録し、展開する方法を示します。 Llama V2の例とは異なる方法で、エンドポイントが初期化されているときにモデルの重みをモデルのエンドポイントに直接ロードし、アーティファクトをMLFLOWモデルレジストリにアップロードせずにロードします。 |
frontend | ?グレードを使用して前のノートブックに展開されているエンドポイントに展開されているモデルの1つに接続するフロントエンドデモアプリのエンドツーエンドの例 |
Databricksでこのリポジトリの使用を開始するには、いくつかの前提条件があります。
/Repos/[email protected]/databricks-llm-prompt-engineering/init/init.sh
accelerate==0.21.0
einops==0.6.1
flash-attn==v1.0.5
ninja
tokenizers==0.13.3
transformers==4.30.2
xformers==0.0.20
? Gradioを使用したFrontEnd Webアプリモデルの展開とリアルタイム推論
?検索拡張生成(RAG)
?§mlflowAIゲートウェイ