Una biblioteca de Python de código abierto creada para permitir a los desarrolladores crear aplicaciones y sistemas con capacidades autónomas de aprendizaje profundo y visión por computadora utilizando pocas líneas de código simples.
Si desea patrocinar este proyecto, visite la página de patrocinadores de Github .
Nosotros, los creadores de ImageAI, nos complace anunciar 2 nuevos proyectos de IA para proporcionar IA generativa, LLM y comprensión de imágenes de última generación en su computadora personal y servidores.
Instale Jarvis en PC/Mac para configurar acceso ilimitado a chats de IA con tecnología LLM para sus necesidades diarias de trabajo, investigación e IA generativa con 100% de privacidad y capacidad total fuera de línea.
Visite https://jarvis.genxr.co para comenzar.
TheiaEngine, la API de IA de visión por computadora de próxima generación capaz de realizar todas las tareas de visión por computadora generativa y de comprensión en una sola llamada API y disponible a través de API REST para todos los lenguajes de programación. Las características incluyen
Visite https://www.genxr.co/theia-engine para probar la demostración y unirse a la prueba beta hoy.
Desarrollado y mantenido por Moses Olafenwa
Creado teniendo en cuenta la simplicidad, ImageAI admite una lista de algoritmos de aprendizaje automático de última generación para capacitación en predicción de imágenes, predicción de imágenes personalizadas, detección de objetos, detección de videos, seguimiento de objetos en videos y predicciones de imágenes. ImageAI actualmente admite la predicción y el entrenamiento de imágenes utilizando 4 algoritmos de aprendizaje automático diferentes entrenados en el conjunto de datos ImageNet-1000. ImageAI también admite la detección de objetos, la detección de videos y el seguimiento de objetos utilizando RetinaNet, YOLOv3 y TinyYOLOv3 entrenados en el conjunto de datos COCO. Finalmente, ImageAI le permite entrenar modelos personalizados para realizar la detección y el reconocimiento de nuevos objetos.
Con el tiempo, ImageAI brindará soporte para aspectos más amplios y especializados de la visión por computadora.
Nueva versión: ImageAI 3.0.2
Qué hay de nuevo:
Para instalar ImageAI, ejecute las instrucciones de instalación de Python a continuación en la línea de comando:
Descargue e instale Python 3.7 , Python 3.8 , Python 3.9 o Python 3.10
Instalar dependencias
CPU : descargue el archivo requisitos.txt e instálelo mediante el comando
pip install -r requirements.txt
o simplemente copie y ejecute el siguiente comando
pip install cython pillow>=7.0.0 numpy>=1.18.1 opencv-python>=4.1.2 torch>=1.9.0 --extra-index-url https://download.pytorch.org/whl/cpu torchvision>=0.10.0 --extra-index-url https://download.pytorch.org/whl/cpu pytest==7.1.3 tqdm==4.64.1 scipy>=1.7.3 matplotlib>=3.4.3 mock==4.0.3
GPU/CUDA : descargue el archivo requisitos_gpu.txt e instálelo mediante el comando
pip install -r requirements_gpu.txt
o simplemente copie y ejecute el siguiente comando
pip install cython pillow>=7.0.0 numpy>=1.18.1 opencv-python>=4.1.2 torch>=1.9.0 --extra-index-url https://download.pytorch.org/whl/cu102 torchvision>=0.10.0 --extra-index-url https://download.pytorch.org/whl/cu102 pytest==7.1.3 tqdm==4.64.1 scipy>=1.7.3 matplotlib>=3.4.3 mock==4.0.3
Si planea entrenar modelos de IA personalizados, descargue el archivo requisitos_extra.txt e instálelo mediante el comando
pip install -r requirements_extra.txt
o simplemente copie y ejecute el siguiente comando
pip install pycocotools@git+https://github.com/gautamchitnis/cocoapi.git@cocodataset-master#subdirectory=PythonAPI
Luego ejecute el siguiente comando para instalar ImageAI
pip install imageai --upgrade
Clasificación de imágenes |
ImageAI proporciona 4 algoritmos y tipos de modelos diferentes para realizar predicciones de imágenes, entrenados en el conjunto de datos ImageNet-1000. Los 4 algoritmos proporcionados para la predicción de imágenes incluyen MobileNetV2, ResNet50, InceptionV3 y DenseNet121. Haga clic en el enlace siguiente para ver los códigos de muestra completos, las explicaciones y la guía de mejores prácticas. |
Detección de objetos |
ImageAI proporciona métodos muy convenientes y poderosos para realizar la detección de objetos en imágenes y extraer cada objeto de la imagen. La clase de detección de objetos brinda soporte para RetinaNet, YOLOv3 y TinyYOLOv3, con opciones para ajustar el rendimiento de última generación o el procesamiento en tiempo real. Haga clic en el enlace siguiente para ver los códigos de muestra completos, las explicaciones y la guía de mejores prácticas. |
Detección y análisis de objetos de vídeo |
ImageAI proporciona métodos muy convenientes y poderosos para realizar la detección de objetos en videos. La clase de detección de objetos de vídeo proporcionada solo es compatible con RetinaNet de última generación. Haga clic en el enlace para ver los videos completos, códigos de muestra, explicaciones y guía de mejores prácticas. |
Entrenamiento del modelo de clasificación personalizado |
ImageAI proporciona clases y métodos para entrenar un nuevo modelo que puede usarse para realizar predicciones en sus propios objetos personalizados. Puede entrenar sus modelos personalizados utilizando MobileNetV2, ResNet50, InceptionV3 y DenseNet en 5 líneas de código. Haga clic en el enlace a continuación para ver la guía para preparar imágenes de capacitación, códigos de capacitación de muestra, explicaciones y mejores prácticas. |
Clasificación de modelos personalizados |
ImageAI proporciona clases y métodos para que pueda ejecutar la predicción de imágenes de sus propios objetos personalizados utilizando su propio modelo entrenado con la clase ImageAI Model Training. Puede utilizar sus modelos personalizados entrenados con MobileNetV2, ResNet50, InceptionV3 y DenseNet y el archivo JSON que contiene la asignación de los nombres de los objetos personalizados. Haga clic en el enlace a continuación para ver la guía de ejemplos de códigos de capacitación, explicaciones y guía de mejores prácticas. |
Entrenamiento de modelo de detección personalizado |
ImageAI proporciona clases y métodos para que pueda entrenar nuevos modelos de detección de objetos YOLOv3 o TinyYOLOv3 en su conjunto de datos personalizado. Esto significa que puede entrenar un modelo para detectar literalmente cualquier objeto de interés proporcionando las imágenes, las anotaciones y entrenando con ImageAI. Haga clic en el enlace a continuación para ver la guía de ejemplos de códigos de capacitación, explicaciones y guía de mejores prácticas. |
Detección de objetos personalizados |
ImageAI ahora proporciona clases y métodos para detectar y reconocer sus propios objetos personalizados en imágenes utilizando su propio modelo entrenado con la claseDetectionModelTrainer. Puede utilizar su modelo YOLOv3 o TinyYOLOv3 personalizado y el archivo **.json** generado durante el entrenamiento. Haga clic en el enlace a continuación para ver la guía de ejemplos de códigos de capacitación, explicaciones y guía de mejores prácticas. |
Detección y análisis de objetos de vídeo personalizados |
ImageAI ahora proporciona clases y métodos para detectar y reconocer sus propios objetos personalizados en imágenes utilizando su propio modelo entrenado con la claseDetectionModelTrainer. Puede utilizar su modelo YOLOv3 o TinyYOLOv3 personalizado y el archivo **.json** generado durante el entrenamiento. Haga clic en el enlace a continuación para ver la guía de ejemplos de códigos de capacitación, explicaciones y guía de mejores prácticas. |
Hemos proporcionado documentación completa para todas las clases y funciones de ImageAI . Visita el siguiente enlace:
ImageAI proporciona implementaciones abstractas y convenientes de tecnologías de visión por computadora de última generación. Todas las implementaciones y el código de ImageAI pueden funcionar en cualquier sistema informático con una capacidad de CPU moderada. Sin embargo, la velocidad de procesamiento de operaciones como predicción de imágenes, detección de objetos y otras en la CPU es lenta y no adecuada para aplicaciones en tiempo real. Para realizar operaciones de visión por computadora en tiempo real con alto rendimiento, debe utilizar tecnologías habilitadas para GPU.
ImageAI utiliza la columna vertebral de PyTorch para sus operaciones de visión por computadora. PyTorch admite CPU y GPU (específicamente GPU NVIDIA. Puede obtener una para su PC o una PC que tenga una) para implementaciones de algoritmos de inteligencia artificial y aprendizaje automático.
Para cualquier persona interesada en construir sistemas de IA y utilizarlos con fines comerciales, económicos, sociales y de investigación, es fundamental que conozca los probables impactos positivos, negativos y sin precedentes que tendrá el uso de dichas tecnologías. También deben conocer los enfoques y prácticas recomendados por expertos de la industria para garantizar que cada uso de la IA aporte un beneficio general a la humanidad. Por lo tanto, recomendamos a todos los que deseen utilizar ImageAI y otras herramientas y recursos de IA que lean la publicación de Microsoft de enero de 2018 sobre IA titulada "El futuro computado: la inteligencia artificial y su papel en la sociedad". Siga el siguiente enlace para descargar la publicación.
https://blogs.microsoft.com/blog/2018/01/17/future-computed-artificial-intelligence-role-society
Puede citar ImageAI en sus proyectos y artículos de investigación a través de la entrada BibTeX a continuación.
@misc {ImageAI,
author = "Moses",
title = "ImageAI, an open source python library built to empower developers to build applications and systems with self-contained Computer Vision capabilities",
url = "https://github.com/OlafenwaMoses/ImageAI",
month = "mar",
year = "2018--"
}