Uma biblioteca python de código aberto criada para capacitar os desenvolvedores a criar aplicativos e sistemas com recursos independentes de aprendizado profundo e visão computacional usando poucas linhas de código simples.
Se você quiser patrocinar este projeto, visite a página do patrocinador no Github .
Nós, os criadores do ImageAI, temos o prazer de anunciar 2 novos projetos de IA para fornecer IA generativa, LLM e compreensão de imagens de última geração em seu computador pessoal e servidores.
Instale Jarvis no PC/Mac para configurar acesso ilimitado a bate-papos de IA com tecnologia LLM para suas necessidades diárias de trabalho, pesquisa e IA generativa com 100% de privacidade e capacidade off-line total.
Visite https://jarvis.genxr.co para começar.
TheiaEngine, a API de IA de visão computacional de última geração, capaz de realizar todas as tarefas de visão computacional generativa e de compreensão em uma única chamada de API e disponível via API REST para todas as linguagens de programação. Os recursos incluem
Visite https://www.genxr.co/theia-engine para experimentar a demonstração e participar do teste beta hoje mesmo.
Desenvolvido e mantido por Moses Olafenwa
Construído com a simplicidade em mente, o ImageAI oferece suporte a uma lista de algoritmos de aprendizado de máquina de última geração para previsão de imagens, previsão de imagens personalizadas, detecção de objetos, detecção de vídeo, rastreamento de objetos de vídeo e treinamentos de previsão de imagens. ImageAI atualmente oferece suporte à previsão e treinamento de imagens usando 4 algoritmos de aprendizado de máquina diferentes treinados no conjunto de dados ImageNet-1000. ImageAI também suporta detecção de objetos, detecção de vídeo e rastreamento de objetos usando RetinaNet, YOLOv3 e TinyYOLOv3 treinados no conjunto de dados COCO. Por fim, ImageAI permite treinar modelos customizados para realizar detecção e reconhecimento de novos objetos.
Eventualmente, a ImageAI fornecerá suporte para aspectos mais amplos e especializados da Visão Computacional
Nova versão: ImageAI 3.0.2
O que há de novo:
Para instalar o ImageAI, execute as instruções de instalação do python abaixo na linha de comando:
Baixe e instale Python 3.7 , Python 3.8 , Python 3.9 ou Python 3.10
Instalar dependências
CPU : Baixe o arquivo requisitos.txt e instale através do comando
pip install -r requirements.txt
ou simplesmente copie e execute o comando abaixo
pip install cython pillow>=7.0.0 numpy>=1.18.1 opencv-python>=4.1.2 torch>=1.9.0 --extra-index-url https://download.pytorch.org/whl/cpu torchvision>=0.10.0 --extra-index-url https://download.pytorch.org/whl/cpu pytest==7.1.3 tqdm==4.64.1 scipy>=1.7.3 matplotlib>=3.4.3 mock==4.0.3
GPU/CUDA : Baixe o arquivo require_gpu.txt e instale através do comando
pip install -r requirements_gpu.txt
ou simplesmente copie e execute o comando abaixo
pip install cython pillow>=7.0.0 numpy>=1.18.1 opencv-python>=4.1.2 torch>=1.9.0 --extra-index-url https://download.pytorch.org/whl/cu102 torchvision>=0.10.0 --extra-index-url https://download.pytorch.org/whl/cu102 pytest==7.1.3 tqdm==4.64.1 scipy>=1.7.3 matplotlib>=3.4.3 mock==4.0.3
Se você planeja treinar modelos de IA personalizados, baixe o arquivo requirements_extra.txt e instale por meio do comando
pip install -r requirements_extra.txt
ou simplesmente copie e execute o comando abaixo
pip install pycocotools@git+https://github.com/gautamchitnis/cocoapi.git@cocodataset-master#subdirectory=PythonAPI
Em seguida, execute o comando abaixo para instalar o ImageAI
pip install imageai --upgrade
Classificação de imagens |
ImageAI fornece 4 algoritmos e tipos de modelos diferentes para realizar previsão de imagens, treinados no conjunto de dados ImageNet-1000. Os 4 algoritmos fornecidos para previsão de imagem incluem MobileNetV2, ResNet50, InceptionV3 e DenseNet121. Clique no link abaixo para ver os exemplos completos de códigos, explicações e guia de práticas recomendadas. |
Detecção de objetos |
ImageAI fornece métodos muito convenientes e poderosos para realizar a detecção de objetos em imagens e extrair cada objeto da imagem. A classe de detecção de objetos fornece suporte para RetinaNet, YOLOv3 e TinyYOLOv3, com opções de ajuste para desempenho de última geração ou processamento em tempo real. Clique no link abaixo para ver os exemplos completos de códigos, explicações e guia de práticas recomendadas. |
Detecção e análise de objetos de vídeo |
ImageAI fornece métodos muito convenientes e poderosos para realizar a detecção de objetos em vídeos. A classe de detecção de objetos de vídeo fornecida oferece suporte apenas ao RetinaNet de última geração. Clique no link para ver os vídeos completos, exemplos de códigos, explicações e guia de práticas recomendadas. |
Treinamento de modelo de classificação personalizada |
ImageAI fornece classes e métodos para você treinar um novo modelo que pode ser usado para realizar previsões em seus próprios objetos personalizados. Você pode treinar seus modelos personalizados usando MobileNetV2, ResNet50, InceptionV3 e DenseNet em 5 linhas de código. Clique no link abaixo para ver o guia para preparar imagens de treinamento, exemplos de códigos de treinamento, explicações e práticas recomendadas. |
Classificação de modelo personalizado |
ImageAI fornece classes e métodos para você executar a previsão de imagem em seus próprios objetos personalizados usando seu próprio modelo treinado com a classe ImageAI Model Training. Você pode usar seus modelos customizados treinados com MobileNetV2, ResNet50, InceptionV3 e DenseNet e o arquivo JSON contendo o mapeamento dos nomes dos objetos customizados. Clique no link abaixo para ver o guia com exemplos de códigos de treinamento, explicações e guia de práticas recomendadas. |
Treinamento de modelo de detecção personalizado |
ImageAI fornece classes e métodos para você treinar novos modelos de detecção de objetos YOLOv3 ou TinyYOLOv3 em seu conjunto de dados personalizado. Isso significa que você pode treinar um modelo para detectar literalmente qualquer objeto de interesse, fornecendo as imagens, as anotações e o treinamento com ImageAI. Clique no link abaixo para ver o guia com exemplos de códigos de treinamento, explicações e guia de práticas recomendadas. |
Detecção de objetos personalizados |
ImageAI agora fornece classes e métodos para você detectar e reconhecer seus próprios objetos personalizados em imagens usando seu próprio modelo treinado com a classe DetectionModelTrainer. Você pode usar seu modelo YOLOv3 ou TinyYOLOv3 treinado personalizado e o arquivo **.json** gerado durante o treinamento. Clique no link abaixo para ver o guia com exemplos de códigos de treinamento, explicações e guia de práticas recomendadas. |
Detecção e análise de objetos de vídeo personalizados |
ImageAI agora fornece classes e métodos para você detectar e reconhecer seus próprios objetos personalizados em imagens usando seu próprio modelo treinado com a classe DetectionModelTrainer. Você pode usar seu modelo YOLOv3 ou TinyYOLOv3 treinado personalizado e o arquivo **.json** gerado durante o treinamento. Clique no link abaixo para ver o guia com exemplos de códigos de treinamento, explicações e guia de práticas recomendadas. |
Fornecemos documentação completa para todas as classes e funções do ImageAI . Acesse o link abaixo:
ImageAI fornece implementações abstratas e convenientes de tecnologias de visão computacional de última geração. Todas as implementações e códigos do ImageAI podem funcionar em qualquer sistema de computador com capacidade moderada de CPU. No entanto, a velocidade de processamento para operações como previsão de imagens, detecção de objetos e outras na CPU é lenta e não adequada para aplicações em tempo real. Para realizar operações de Visão Computacional em tempo real com alto desempenho, você precisa usar tecnologias habilitadas para GPU.
ImageAI usa o backbone PyTorch para suas operações de visão computacional. PyTorch oferece suporte a CPUs e GPUs (especificamente GPUs NVIDIA. Você pode obter uma para o seu PC ou um PC que tenha uma) para implementações de algoritmos de aprendizado de máquina e inteligência artificial.
Para qualquer pessoa interessada em construir sistemas de IA e utilizá-los para fins empresariais, económicos, sociais e de investigação, é fundamental que conheça os prováveis impactos positivos, negativos e sem precedentes que a utilização de tais tecnologias terá. Devem também estar cientes das abordagens e práticas recomendadas por especialistas experientes da indústria para garantir que cada utilização da IA traga benefícios globais para a humanidade. Portanto, recomendamos a todos que desejam usar o ImageAI e outras ferramentas e recursos de IA que leiam a publicação da Microsoft de janeiro de 2018 sobre IA intitulada "O Futuro Computado: Inteligência Artificial e seu papel na sociedade". Por favor, siga o link abaixo para baixar a publicação.
https://blogs.microsoft.com/blog/2018/01/17/future-computed-artificial-intelligence-role-society
Você pode citar ImageAI em seus projetos e artigos de pesquisa por meio da entrada BibTeX abaixo.
@misc {ImageAI,
author = "Moses",
title = "ImageAI, an open source python library built to empower developers to build applications and systems with self-contained Computer Vision capabilities",
url = "https://github.com/OlafenwaMoses/ImageAI",
month = "mar",
year = "2018--"
}