databricks llm prompt engineering
1.0.0
A partir del 29/08/2023, encontrará los siguientes ejemplos en la carpeta notebooks
:
?? ️ customer_service
Artefacto | Descripción |
---|---|
hf_mlflow_crash_course | ? Proporciona un ejemplo básico que usa la cara de abrazo para entrenar un modelo de clasificación de intención utilizando distilbert-qa . También muestra conceptos fundamentales de MLFLOW, como el seguimiento de los experimentos, el registro de artefactos y el registro del modelo. |
primer | ? Mayormente cuaderno conceptual. Contiene explicaciones sobre ingeniería rápida y conceptos fundamentales como el muestreo K Top K , el muestreo P Top P y la temperatura . |
basic_prompt_evaluation | ? Demuestra ingeniería rápida básica con modelos LLM livianos. Además de esto, muestra las nuevas características de LLM de MLFlow, como mlflow.evaluate() . |
few_shot_learning | ? Aquí exploramos pocos aprendizaje de disparos con un LLM basado en instrucciones (MPT-7B-Instructo). |
active_prompting | ? Además, demostramos cómo aprovechar VLLM para lograr mejoras de latencia de inferencia 7x - 10x. |
llama2_mlflow_logging_inference | Aquí mostramos cómo registrar, registrar e implementar un modelo LLAMA V2 en MLFLOW |
mpt_mlflow_logging_inference | Aquí mostramos cómo registrar, registrar e implementar un modelo MPT-Instructo en MLFLOW. De manera diferente al ejemplo de LLAMA V2, aquí cargamos pesos del modelo directamente en el punto final de servicio del modelo cuando se inicializa el punto final, sin cargar los artefactos en el registro del modelo MLFLOW. |
frontend | ? Ejemplo de extremo a extremo de una aplicación de demostración frontend que se conecta a uno de los puntos finales que sirven al modelo implementado en el cuaderno anterior usando Gradio |
Para comenzar a usar este repositorio en Databricks, hay algunos requisitos previos:
/Repos/[email protected]/databricks-llm-prompt-engineering/init/init.sh
accelerate==0.21.0
einops==0.6.1
flash-attn==v1.0.5
ninja
tokenizers==0.13.3
transformers==4.30.2
xformers==0.0.20
? Aplicación web frontend utilizando Gradio Despliegue de modelo e inferencia en tiempo real
? Recuperación de generación aumentada (trapo)
? ️ mlflow ai gateway