開発者がシンプルな数行のコードを使用して、自己完結型の深層学習およびコンピューター ビジョン機能を備えたアプリケーションとシステムを構築できるようにするために構築されたオープンソースの Python ライブラリ。
このプロジェクトのスポンサーになりたい場合は、 Github のスポンサー ページにアクセスしてください。
私たち ImageAI の作成者は、最先端の生成 AI、LLM、画像理解をパーソナル コンピューターとサーバー上で提供する 2 つの新しい AI プロジェクトを発表できることをうれしく思います。
Jarvis を PC/Mac にインストールすると、毎日の仕事、研究、生成 AI のニーズに合わせて、100% のプライバシーと完全なオフライン機能を備えた LLM 搭載 AI チャットへの無制限のアクセスをセットアップできます。
開始するには、https://jarvis.genxr.co にアクセスしてください。
TheiaEngine は、単一の API 呼び出しですべての生成タスクと理解コンピューター ビジョン タスクを実行できる次世代コンピューター ビジョン AI API であり、REST API を介してすべてのプログラミング言語で利用できます。特徴としては以下が挙げられます
https://www.genxr.co/theia-engine にアクセスしてデモを試し、今すぐベータ テストに参加してください。
Moses Olafenwa によって開発および保守されました
シンプルさを念頭に置いて構築されたImageAI は、画像予測、カスタム画像予測、オブジェクト検出、ビデオ検出、ビデオ オブジェクト追跡、画像予測トレーニング用の最先端の機械学習アルゴリズムのリストをサポートしています。 ImageAI は現在、ImageNet-1000 データセットでトレーニングされた 4 つの異なる機械学習アルゴリズムを使用した画像予測とトレーニングをサポートしています。 ImageAI は、 COCO データセットでトレーニングされた RetinaNet、YOLOv3、TinyYOLOv3 を使用したオブジェクト検出、ビデオ検出、オブジェクト追跡もサポートしています。最後に、 ImageAI を使用すると、新しいオブジェクトの検出と認識を実行するためのカスタム モデルをトレーニングできます。
最終的に、 ImageAI は、コンピューター ビジョンのより広範でより特殊な側面をサポートするようになります。
新しいリリース: ImageAI 3.0.2
新着情報:
ImageAI をインストールするには、コマンド ラインで以下の Python インストール手順を実行します。
Python 3.7 、 Python 3.8 、 Python 3.9またはPython 3.10をダウンロードしてインストールします。
依存関係をインストールする
CPU :requirements.txtファイルをダウンロードし、コマンドでインストールします。
pip install -r requirements.txt
または、単に以下のコマンドをコピーして実行します
pip install cython pillow>=7.0.0 numpy>=1.18.1 opencv-python>=4.1.2 torch>=1.9.0 --extra-index-url https://download.pytorch.org/whl/cpu torchvision>=0.10.0 --extra-index-url https://download.pytorch.org/whl/cpu pytest==7.1.3 tqdm==4.64.1 scipy>=1.7.3 matplotlib>=3.4.3 mock==4.0.3
GPU/CUDA :requirements_gpu.txt ファイルをダウンロードし、コマンドでインストールします。
pip install -r requirements_gpu.txt
または、以下のコマンドをコピーして実行します
pip install cython pillow>=7.0.0 numpy>=1.18.1 opencv-python>=4.1.2 torch>=1.9.0 --extra-index-url https://download.pytorch.org/whl/cu102 torchvision>=0.10.0 --extra-index-url https://download.pytorch.org/whl/cu102 pytest==7.1.3 tqdm==4.64.1 scipy>=1.7.3 matplotlib>=3.4.3 mock==4.0.3
カスタム AI モデルをトレーニングする予定がある場合は、requirements_extra.txt ファイルをダウンロードし、コマンドでインストールします。
pip install -r requirements_extra.txt
または、単に以下のコマンドをコピーして実行します
pip install pycocotools@git+https://github.com/gautamchitnis/cocoapi.git@cocodataset-master#subdirectory=PythonAPI
次に、以下のコマンドを実行して ImageAI をインストールします
pip install imageai --upgrade
画像の分類 |
ImageAI は、ImageNet-1000 データセットでトレーニングされた画像予測を実行するための 4 つの異なるアルゴリズムとモデル タイプを提供します。画像予測用に提供される 4 つのアルゴリズムには、MobileNetV2、ResNet50、InceptionV3、DenseNet121 が含まれます。完全なサンプル コード、説明、ベスト プラクティス ガイドを参照するには、下のリンクをクリックしてください。 |
物体検出 |
ImageAI は、画像上でオブジェクト検出を実行し、画像から各オブジェクトを抽出するための非常に便利で強力な方法を提供します。オブジェクト検出クラスは、RetinaNet、YOLOv3、および TinyYOLOv3 のサポートを提供し、最先端のパフォーマンスまたはリアルタイム処理に合わせて調整するオプションを提供します。完全なサンプル コード、説明、ベスト プラクティス ガイドを参照するには、下のリンクをクリックしてください。 |
ビデオオブジェクトの検出と分析 |
ImageAI は、ビデオ内のオブジェクト検出を実行するための非常に便利で強力な方法を提供します。提供されるビデオ オブジェクト検出クラスは、現在の最先端の RetinaNet のみをサポートします。リンクをクリックすると、完全なビデオ、サンプル コード、説明、ベスト プラクティス ガイドが表示されます。 |
カスタム分類モデルのトレーニング |
ImageAI は、独自のカスタム オブジェクトに対して予測を実行するために使用できる新しいモデルをトレーニングするためのクラスとメソッドを提供します。 MobileNetV2、ResNet50、InceptionV3、DenseNet を使用してカスタム モデルを 5 行のコードでトレーニングできます。下のリンクをクリックして、トレーニング画像、サンプル トレーニング コード、説明、ベスト プラクティスを準備するためのガイドをご覧ください。 |
カスタムモデルの分類 |
ImageAI は、ImageAI モデル トレーニング クラスでトレーニングされた独自のモデルを使用して、独自のカスタム オブジェクトの画像予測を実行するためのクラスとメソッドを提供します。 MobileNetV2、ResNet50、InceptionV3、DenseNet でトレーニングされたカスタム モデルと、カスタム オブジェクト名のマッピングを含む JSON ファイルを使用できます。サンプル トレーニング コード、説明、ベスト プラクティス ガイドのガイドを表示するには、下のリンクをクリックしてください。 |
カスタム検出モデルのトレーニング |
ImageAI は、カスタム データセットで新しい YOLOv3 または TinyYOLOv3 オブジェクト検出モデルをトレーニングするためのクラスとメソッドを提供します。これは、画像、注釈を提供し、ImageAI でトレーニングすることで、文字通りあらゆる対象オブジェクトを検出するようにモデルをトレーニングできることを意味します。サンプル トレーニング コード、説明、ベスト プラクティス ガイドのガイドを表示するには、下のリンクをクリックしてください。 |
カスタムオブジェクトの検出 |
ImageAI は、DetectionModelTrainer クラスでトレーニングされた独自のモデルを使用して、画像内の独自のカスタム オブジェクトを検出および認識するためのクラスとメソッドを提供するようになりました。カスタム トレーニングされた YOLOv3 または TinyYOLOv3 モデルと、トレーニング中に生成された **.json** ファイルを使用できます。サンプル トレーニング コード、説明、ベスト プラクティス ガイドのガイドを表示するには、下のリンクをクリックしてください。 |
カスタムビデオオブジェクトの検出と分析 |
ImageAI は、DetectionModelTrainer クラスでトレーニングされた独自のモデルを使用して、画像内の独自のカスタム オブジェクトを検出および認識するためのクラスとメソッドを提供するようになりました。カスタム トレーニングされた YOLOv3 または TinyYOLOv3 モデルと、トレーニング中に生成された **.json** ファイルを使用できます。サンプル トレーニング コード、説明、ベスト プラクティス ガイドのガイドを表示するには、下のリンクをクリックしてください。 |
すべてのImageAIクラスと関数に関する完全なドキュメントを提供しました。以下のリンクにアクセスしてください。
ImageAI は、最先端のコンピューター ビジョン テクノロジーの抽象化された便利な実装を提供します。 ImageAI の実装とコードはすべて、適度な CPU 能力を備えたコンピューター システムで動作します。ただし、画像予測や物体検出などのCPU上での処理速度は遅く、リアルタイム用途には適していません。リアルタイムの Computer Vision 操作を高いパフォーマンスで実行するには、GPU 対応テクノロジを使用する必要があります。
ImageAI は、 Computer Vision の操作に PyTorch バックボーンを使用します。 PyTorch は、機械学習と人工知能アルゴリズムの実装のために、CPU と GPU (具体的には NVIDIA GPU。PC 用に 1 つを入手するか、GPU を備えた PC を入手することができます) の両方をサポートします。
AI システムを構築し、それをビジネス、経済、社会、研究目的で使用することに興味がある人にとって、そのようなテクノロジーの使用がもたらす可能性のあるプラス、マイナス、そして前例のない影響を理解することが重要です。また、AI のあらゆる使用が人類に全体的な利益をもたらすことを保証するために、経験豊富な業界専門家が推奨するアプローチや実践方法も認識しておく必要があります。したがって、ImageAI やその他の AI ツールやリソースを使用したいと考えているすべての人に、Microsoft が 2018 年 1 月に発行した AI に関する出版物「The Future Computed : Artificial Intelligence and its role in social」を読むことをお勧めします。下記のリンクから出版物をダウンロードしてください。
https://blogs.microsoft.com/blog/2018/01/17/future-computed-artificial-intelligence-role-society
以下のBibTeXエントリを介して、プロジェクトや研究論文でImageAI を引用できます。
@misc {ImageAI,
author = "Moses",
title = "ImageAI, an open source python library built to empower developers to build applications and systems with self-contained Computer Vision capabilities",
url = "https://github.com/OlafenwaMoses/ImageAI",
month = "mar",
year = "2018--"
}