Los módulos AIOps son una colección de módulos de infraestructura como código (IAC) reutilizables que funcionan con SeedFarmer CLI. Consulte los DOCS para conocer todo lo relacionado con los agricultores de semillas.
Los módulos de este repositorio están desacoplados entre sí y se pueden agregar utilizando los principios de GitOps (archivo de manifiesto) proporcionados por seedfarmer
y lograr los casos de uso deseados. Elimina el trabajo pesado indiferenciado para un usuario final al proporcionar módulos reforzados y le permite concentrarse en desarrollar negocios sobre ellos.
Los módulos de este repositorio son/deben ser genéricos para su reutilización sin afiliación a ningún proyecto en particular en el dominio de Machine Learning y Foundation Model Operations.
Todos los módulos de este repositorio se adhieren a la estructura de módulos definida en la Guía de SeedFarmer.
Consulte los pasos de implementación en la Guía de implementación.
Casos de uso de ejemplo de un extremo a otro creados utilizando módulos en este repositorio.
Tipo | Descripción |
---|---|
MLOps con Amazon SageMaker | Configure el entorno para MLOps con Amazon SageMaker. Implemente un dominio seguro de Amazon SageMaker Studio y aprovisione plantillas de proyectos de SageMaker mediante el catálogo de servicios, incluido el entrenamiento y la implementación de modelos. |
Ray en el servicio Amazon Elastic Kubernetes (EKS) | Ejecute Ray en AWS EKS. Implementa un clúster de AWS EKS, un operador KubeRay Ray y un clúster Ray con el escalado automático habilitado. |
Ajuste 6B LLM (GPT-J) usando Ray en Amazon EKS | Ejecute el ajuste fino de 6B GPT-J LLM. Implementa un clúster de AWS EKS, un operador KubeRay Ray y un clúster Ray con el escalado automático habilitado y ejecuta un trabajo de ajuste. ¿Cómo ajustar un 6B LLM de manera simple y rentable usando Ray en Amazon EKS? |
Servidor de seguimiento de mlflow y registro de modelos con Amazon SageMaker | Un ejemplo que utiliza el seguimiento de experimentos de Mlflow, el registro de modelos y el seguimiento de LLM con Amazon SageMaker. Implemente un servidor de seguimiento Mlflow autohospedado y un registro de modelos en AWS Fargate y en el entorno de dominio de Amazon SageMaker Studio. |
Flujos de trabajo administrados con Apache Airflow (MWAA) para capacitación en aprendizaje automático | Un ejemplo de orquestación de trabajos de capacitación de ML con flujos de trabajo administrados para Apache Airflow (MWAA). Implementa MWAA y un DAG de entrenamiento de ML de ejemplo. |
MLOps con funciones escalonadas | Automatice el ciclo de vida del aprendizaje automático mediante Amazon SageMaker y AWS Step Functions. |
Ajuste fino de Bedrock con funciones escalonadas | Ajuste continuamente un modelo básico con trabajos de ajuste fino de Bedrock y funciones escalonadas de AWS. |
Base de conocimientos de AppSync Ingestión y preguntas y respuestas RAG | Crea un punto final Graphql para la ingesta de datos y su uso como base de conocimiento para un modelo de preguntas y respuestas utilizando RAG. |
Tipo | Descripción |
---|---|
Módulo de estudio SageMaker | Proporciona un entorno de dominio seguro de SageMaker Studio, crea perfiles de usuario de ejemplo para científicos de datos y científicos de datos principales vinculados a funciones de IAM y agrega configuración del ciclo de vida. |
Módulo de punto final de SageMaker | Crea un punto final de inferencia en tiempo real de SageMaker para el paquete de modelo especificado o el último modelo aprobado del grupo de paquetes de modelo. |
Plantillas de proyectos de SageMaker a través del módulo de catálogo de servicios | Proporciona plantillas de proyectos de SageMaker para una organización. Las plantillas están disponibles mediante SageMaker Studio Classic o Service Catalog. Plantillas disponibles: - Entrenar un modelo en el conjunto de datos Abalone usando XGBoost - Realizar inferencia por lotes - Implementación del modelo multicuenta - Plantilla de importación de modelo HuggingFace - Ajuste y evaluación del LLM. |
Módulo de instancia de cuaderno de SageMaker | Crea una instancia segura de SageMaker Notebook para el científico de datos y clona el código fuente en el espacio de trabajo. |
Módulo de kernel personalizado de SageMaker | Crea un kernel personalizado para SageMaker Studio a partir de un Dockerfile |
Módulo de grupo de paquetes de modelos de SageMaker | Crea un grupo de paquetes de modelos de SageMaker para registrar y versionar los modelos de aprendizaje automático (ML) de SageMaker y configura una regla de Amazon EventBridge para enviar eventos de cambio de estado del grupo de paquetes de modelos a un bus de Amazon EventBridge. |
Paquete de modelo de SageMaker Módulo de promoción de canalización | Implemente una canalización para promocionar paquetes de modelos de SageMaker en una configuración de múltiples cuentas. La canalización se puede activar a través de una regla de EventBridge como reacción a un cambio de evento de estado del grupo de paquetes de modelos de SageMaker (Aprobado/Rechazado). Una vez que se activa la canalización, promoverá el último paquete modelo aprobado, si se encuentra alguno. |
Módulo de monitoreo de modelos de SageMaker | Implemente trabajos de monitoreo de la calidad de los datos, la calidad del modelo, el sesgo del modelo y la explicabilidad del modelo que se ejecutan en un endpoint de SageMaker. |
Módulo CICD modelo SageMaker | Crea una canalización CICD integral utilizando AWS CodePipelines para crear e implementar un modelo de aprendizaje automático en SageMaker. |
Módulo de etiquetado de verdad de SageMaker Ground | Crea una máquina de estado para permitir el etiquetado de imágenes y archivos de texto, cargados en el depósito de carga, utilizando varios tipos de tareas integradas en SageMaker Ground Truth. |
Tipo | Descripción |
---|---|
Módulo de imagen Mlflow | Crea una imagen de Docker de Mlflow Tracing Server y envía la imagen a Elastic Container Registry |
Mlflow en el módulo AWS Fargate | Ejecuta el contenedor Mlflow en AWS Fargate en un Elastic Container Service con equilibrio de carga. Admite Elastic File System y Relational Database Store para persistencia de metadatos y S3 para almacenamiento de artefactos |
Módulo de imagen de puerta de enlace Mlflow AI | Crea una imagen de Mlflow AI Gateway Docker y envía la imagen a Elastic Container Registry |
Tipo | Descripción |
---|---|
Módulo de punto final del modelo JumpStart Foundation de SageMaker | Crea un punto final para un modelo JumpStart Foundation de SageMaker. |
Módulo de punto final del modelo Hugging Face Foundation de SageMaker | Crea un punto final para un modelo de SageMaker Hugging Face Foundation. |
Módulo de ajuste fino de Amazon Bedrock | Crea una canalización que activa automáticamente Amazon Bedrock Finetuning. |
Módulo RAG de ingestión y preguntas y respuestas de la base de conocimientos de AppSync | Crea un punto final Graphql para la ingesta de datos y su uso como base de conocimiento para un modelo de preguntas y respuestas utilizando RAG. |
Tipo | Descripción |
---|---|
Ejemplo de DAG para el módulo MLOps | Implementa un DAG de muestra en MWAA que demuestra MLOP y utiliza el módulo MWAA de IDF |
Tipo | Descripción |
---|---|
Ejemplo de MLOps que utilizan funciones escalonadas | Implementa una máquina de estado de AWS en AWS Step Functions que demuestra cómo implementar los MLOP utilizando AWS Step Functions. |
Tipo | Descripción |
---|---|
Módulo de operador de rayos | Aprovisiona un operador de rayos en EKS. |
Módulo de clúster de rayos | Aprovisiona un Ray Cluster en EKS. Requiere un operador de rayos. |
Módulo de orquestador de rayos | Crea una función de paso para orquestar el envío de un trabajo de Ray de muestra que ajusta los parámetros del modelo de lenguaje grande GPT-J 6B en un pequeño conjunto de datos de Shakespeare y realiza inferencia. |
Módulo de imagen de rayos | Un ejemplo que crea una imagen de Ray personalizada y la envía a ECR. |
Tipo | Descripción |
---|---|
Módulo de bus de eventos | Crea un bus de Amazon EventBridge para eventos entre cuentas. |
Módulo Personas | Este módulo es un ejemplo que crea varios roles necesarios para un proyecto de IA/ML. |
Los módulos de este repositorio son compatibles con los módulos Industry Data Framework (IDF) y se pueden utilizar juntos dentro de la misma implementación. Consulte examples/manifests
para ver ejemplos.
Los módulos de este repositorio son compatibles con los módulos del marco de datos de conducción autónoma (ADDF) y se pueden utilizar juntos dentro de la misma implementación.