Importante
Este repositorio ha quedado en desuso y solo está destinado a lanzar proyectos de Instill Core hasta la versión v0.12.0-beta
, donde la versión de Instill Model corresponde a v0.9.0-alpha
en este repositorio en desuso. Consulte el último proyecto de Instill Core en el repositorio instill-ai/instill-core.
⚗️ Instill Model , o simplemente Model , es un componente integral del proyecto Instill Core. Sirve como una plataforma avanzada ModelOps/LLMOps centrada en permitir a los usuarios importar, servir, ajustar y monitorear sin problemas modelos de aprendizaje automático (ML) para una optimización continua.
macOS o Linux : Instill Model funciona en macOS o Linux, pero aún no es compatible con Windows.
Docker y Docker Compose : Instill Model utiliza Docker Compose (específicamente, Compose V2
y Compose specification
) para ejecutar todos los servicios localmente. Instale la última versión estable de Docker y Docker Compose antes de usar Instill Model.
yq
> v4.x
Siga la guía de instalación.
(Opcional) NVIDIA Container Toolkit : para habilitar la compatibilidad con GPU en Instill Model, consulte la documentación nativa de la nube de NVIDIA para instalar NVIDIA Container Toolkit. Si desea asignar GPU específicamente a Instill Model, puede configurar la variable de entorno NVIDIA_VISIBLE_DEVICES
. Por ejemplo, NVIDIA_VISIBLE_DEVICES=0,1
hará que el triton-server
consuma los ID de dispositivo GPU 0
y 1
específicamente. De forma predeterminada, NVIDIA_VISIBLE_DEVICES
está configurado en all
para usar todas las GPU disponibles en la máquina.
Nota La imagen del backend del modelo (~2 GB) y del servidor de inferencia Triton (~23 GB) puede tardar un poco en extraerse, pero esto debería ser un esfuerzo único en la primera configuración.
Utilice la versión de lanzamiento estable
Ejecute los siguientes comandos para extraer imágenes prediseñadas con todas las dependencias para iniciar:
$ git clone -b v0.10.0-alpha https://github.com/instill-ai/deprecated-model.git && cd deprecated-model
# Launch all services
$ make all
¡Eso es todo! Una vez que todos los servicios estén en funcionamiento, la interfaz de usuario estará lista para funcionar en http://localhost:3000. Encuentre las credenciales de inicio de sesión predeterminadas en la documentación.
Para cerrar todos los servicios en ejecución:
$ make down
Explore la documentación para descubrir todas las opciones de implementación disponibles.
Seleccionamos una lista de modelos listos para usar. Estos modelos previamente entrenados provienen de diferentes fuentes y han sido entrenados e implementados por nuestro equipo. ¿Quieres contribuir con un nuevo modelo? Cree un problema, estaremos encantados de agregarlo a la lista.
Modelo | Tarea | Fuentes | Estructura | UPC | GPU |
---|---|---|---|---|---|
MobileNet v2 | Clasificación de imágenes | GitHub-DVC | ONNX | ✅ | ✅ |
Transformador de visión (ViT) | Clasificación de imágenes | abrazando la cara | ONNX | ✅ | |
YOLOv4 | Detección de objetos | GitHub-DVC | ONNX | ✅ | ✅ |
YOLOv7 | Detección de objetos | GitHub-DVC | ONNX | ✅ | ✅ |
YOLOv7 W6 Pose | Detección de puntos clave | GitHub-DVC | ONNX | ✅ | ✅ |
PSNet + EasyOCR | Reconocimiento óptico de caracteres (OCR) | GitHub-DVC | ONNX | ✅ | ✅ |
Máscara RCNN | Segmentación de instancias | GitHub-DVC | PyTorch | ✅ | ✅ |
Lite R-ASPP basado en MobileNetV3 | Segmentación semántica | GitHub-DVC | ONNX | ✅ | ✅ |
Difusión estable | Texto a imagen | GitHub-DVC, CPU local, GPU local | ONNX | ✅ | ✅ |
Difusión estable XL | Texto a imagen | GitHub-DVC | PyTorch | ✅ | |
Red de control - Astuto | Imagen a imagen | GitHub-DVC | PyTorch | ✅ | |
Megatrón GPT2 | Generación de texto | GitHub-DVC | Transformador más rápido | ✅ | |
llama2 | Generación de texto | GitHub-DVC | vLLM, PyTorch | ✅ | ✅ |
Código Llama | Generación de texto | GitHub-DVC | vllm | ✅ | |
Chat Llama2 | Chat de generación de texto | GitHub-DVC | vllm | ✅ | |
MosaicML MPT | Chat de generación de texto | GitHub-DVC | vllm | ✅ | |
Mistral | Chat de generación de texto | GitHub-DVC | vllm | ✅ | |
Céfiro-7b | Chat de generación de texto | GitHub-DVC | PyTorch | ✅ | ✅ |
llama | Respuesta visual a preguntas | GitHub-DVC | PyTorch | ✅ |
Nota: La fuente GitHub-DVC
en la tabla significa importar un modelo a Instill Model desde un repositorio de GitHub que usa DVC para administrar archivos grandes.
Consulte el archivo LICENCIA para obtener información sobre la licencia.