ドキュメント |不和 |ツイッター |リンクトイン
Albumentations は、画像拡張のための Python ライブラリです。画像拡張は、トレーニングされたモデルの品質を向上させるために、深層学習およびコンピューター ビジョン タスクで使用されます。画像拡張の目的は、既存のデータから新しいトレーニング サンプルを作成することです。
以下は、Albumentations からピクセル レベルの拡張を適用して、元の画像から新しい画像を作成する方法の例です。
完全なコンピューター ビジョン サポート: 分類、セグメンテーション (セマンティックおよびインスタンス)、オブジェクト検出、姿勢推定を含むすべての主要な CV タスクで動作します。
シンプルな統合 API : RGB/グレースケール/マルチスペクトル画像、マスク、バウンディング ボックス、キーポイントなど、すべてのデータ タイプに対応する 1 つの一貫したインターフェイス。
豊富な拡張ライブラリ: トレーニング データを強化するための 70 以上の高品質な拡張。
高速: 運用環境での使用向けに最適化されており、最速の拡張ライブラリとして一貫してベンチマークされています。
深層学習の統合: PyTorch、TensorFlow、およびその他のフレームワークと連携します。 PyTorch エコシステムの一部。
専門家による作成: コンピューター ビジョンや機械学習のコンテストで深い経験を持つ開発者によって構築されています。
アルバムは開発者の貢献によって発展します。プロジェクトのインフラ維持にご協力いただいているスポンサーに感謝いたします。
?ゴールドスポンサー |
---|
あなたの会社もここにあるかもしれません |
?シルバースポンサー |
---|
?ブロンズスポンサー |
---|
スポンサーシップは、自由時間を費やしてアルバムの構築と保守を行っているメンテナーや貢献者に「ありがとう」を伝える方法です。スポンサーは当社の Web サイトと README で紹介されています。 GitHub スポンサーでスポンサーシップ層を表示する
アルバムメンテーション
システム情報
ベンチマークパラメータ
ライブラリのバージョン
Inria データセットのセマンティック セグメンテーション
医用画像処理
Mapillary Vistas データセットでのオブジェクト検出とセマンティック セグメンテーション
キーポイントの拡張
ピクセルレベルの変換
空間レベルの変換
こちらも参照
画像拡張は初めてです
分類やセグメンテーションなどの特定のタスクにアルバムメンテーションを使用したい
深層学習フレームワークでアルバムを使用する方法を知りたい
オーグメンテーションを調べて、実際のアルブメンテーションを見てみたい
現在の管理者
名誉コアチームメンバー
?スポンサーになる
なぜアルバムを使用するのか
コミュニティ主導のプロジェクト、支援者
目次
著者
インストール
ドキュメント
簡単な例
はじめる
アルバムメンテーションを使用しているのは誰ですか
拡張のリスト
拡張の例をさらにいくつか
ベンチマーク結果
性能比較
貢献する
コミュニティ
引用
ウラジミール・I・イグロヴィコフ| Kaggle グランドマスター
ミハイル・ドルジーニン| Kaggle エキスパート
アレックス・パリノフカグルマスター
アレクサンダー・ブスラエフ|カグルマスター
ユージン・クヴェドチェンヤ| Kaggle グランドマスター
アルバム作成には Python 3.9 以降が必要です。 PyPI から最新バージョンをインストールするには:
pip install -U アルバムメンテーション
他のインストール オプションについてはドキュメントで説明されています。
完全なドキュメントはhttps://albumentations.ai/docs/で入手できます。
import albumentations as Aimport cv2# 拡張パイプラインを宣言しますtransform = A.Compose([A.RandomCrop(width=256, height=256),A.horizontalflip(p=0.5),A.RandomBrightnessContrast(p=0.2), ])# OpenCV で画像を読み取り、RGB 色空間に変換しますimage = cv2.imread("image.jpg")image = cv2.cvtColor(image, cv2.COLOR_BGR2RGB)# 画像を拡張しますtransformed = transform(image=image)transformed_image = 変換された["画像"]
画像拡張がなぜ重要なのか、そしてそれがより良いモデルの構築にどのように役立つのかについての紹介記事から始めてください。
分類、セグメンテーション、オブジェクト検出などの特定のタスクにアルバムメンテーションを使用する場合は、このタスクについて詳しく説明した一連の記事を参照してください。さまざまなユースケースにアルバムを適用する例のリストもあります。
Albumentations を PyTorch および TensorFlow とともに使用する例があります。
ライブラリのオンライン デモを確認してください。これを使用すると、さまざまな画像に拡張を適用し、結果を確認できます。また、利用可能なすべての拡張とそのターゲットのリストもあります。
Albumentations を引用する論文のリスト。
Albumentations を使用するオープンソース プロジェクト。
ピクセルレベルの変換では、入力イメージのみが変更され、マスク、境界ボックス、キーポイントなどの追加のターゲットは変更されません。ピクセルレベルの変換のリスト:
アディティブノイズ
アドバンスブラー
オートコントラスト
ぼかし
クラエ
チャンネルドロップアウト
チャンネルシャッフル
色収差
カラージッター
焦点をぼかす
ダウンスケール
エンボス
イコライズ
FDA
ファンシーPCA
FromFloat
ガウスノイズ
ガウスブラー
ガラスブラー
ヒストグラムマッチング
色相彩度値
ISOノイズ
照明
画像圧縮
反転画像
メディアンブラー
モーションブラー
乗算的ノイズ
ノーマライズ
ピクセル分布適応
プランキアンジッター
プラズマ輝度コントラスト
プラズマシャドウ
ポスタリゼーション
RGBシフト
ランダム明るさコントラスト
ランダム霧
ランダムガンマ
ランダム砂利
ランダム雨
ランダムシャドウ
ランダムスノー
ランダムサンフレア
ランダムトーンカーブ
リンギングオーバーシュート
ソルトアンドペッパー
研ぐ
ショットノイズ
ソラリゼーション
スパッタ
スーパーピクセル
テンプレート変換
テキスト画像
フロートする
トゥグレー
ToRGB
セピアへ
アンシャープマスク
ズームブラー
空間レベルの変換では、入力イメージと、マスク、バウンディング ボックス、キーポイントなどの追加ターゲットの両方を同時に変更します。次の表は、各変換でサポートされる追加ターゲットを示しています。
変身 | 画像 | マスク | Bボックス | キーポイント |
---|---|---|---|---|
アフィン | ✓ | ✓ | ✓ | ✓ |
BBoxSafeランダムクロップ | ✓ | ✓ | ✓ | ✓ |
センタークロップ | ✓ | ✓ | ✓ | ✓ |
粗いドロップアウト | ✓ | ✓ | ✓ | ✓ |
作物 | ✓ | ✓ | ✓ | ✓ |
クロップアンドパッド | ✓ | ✓ | ✓ | ✓ |
CropNonEmptyMaskIfExists | ✓ | ✓ | ✓ | ✓ |
D4 | ✓ | ✓ | ✓ | ✓ |
弾性変形 | ✓ | ✓ | ✓ | ✓ |
消去 | ✓ | ✓ | ✓ | ✓ |
周波数マスキング | ✓ | ✓ | ✓ | ✓ |
グリッドディストーション | ✓ | ✓ | ✓ | ✓ |
グリッドドロップアウト | ✓ | ✓ | ✓ | ✓ |
グリッド弾性変形 | ✓ | ✓ | ✓ | ✓ |
水平反転 | ✓ | ✓ | ✓ | ✓ |
ラムダ | ✓ | ✓ | ✓ | ✓ |
最長最大サイズ | ✓ | ✓ | ✓ | ✓ |
マスクドロップアウト | ✓ | ✓ | ✓ | ✓ |
形態学的 | ✓ | ✓ | ✓ | ✓ |
ノーオプ | ✓ | ✓ | ✓ | ✓ |
光学歪み | ✓ | ✓ | ✓ | ✓ |
オーバーレイ要素 | ✓ | ✓ | ||
パッド | ✓ | ✓ | ✓ | ✓ |
パッドが必要な場合 | ✓ | ✓ | ✓ | ✓ |
視点 | ✓ | ✓ | ✓ | ✓ |
区分的アフィン | ✓ | ✓ | ✓ | ✓ |
ピクセルドロップアウト | ✓ | ✓ | ✓ | ✓ |
ランダムクロップ | ✓ | ✓ | ✓ | ✓ |
ボーダーからランダムに切り取る | ✓ | ✓ | ✓ | ✓ |
ランダムクロップNearBBox | ✓ | ✓ | ✓ | ✓ |
ランダムグリッドシャッフル | ✓ | ✓ | ✓ | ✓ |
ランダムサイズ変更クロップ | ✓ | ✓ | ✓ | ✓ |
ランダム回転90 | ✓ | ✓ | ✓ | ✓ |
ランダムスケール | ✓ | ✓ | ✓ | ✓ |
RandomSizedBBoxSafeCrop | ✓ | ✓ | ✓ | ✓ |
ランダムサイズの作物 | ✓ | ✓ | ✓ | ✓ |
サイズ変更 | ✓ | ✓ | ✓ | ✓ |
回転 | ✓ | ✓ | ✓ | ✓ |
安全回転 | ✓ | ✓ | ✓ | ✓ |
シフトスケール回転 | ✓ | ✓ | ✓ | ✓ |
最小最大サイズ | ✓ | ✓ | ✓ | ✓ |
薄板スプライン | ✓ | ✓ | ✓ | ✓ |
タイムマスキング | ✓ | ✓ | ✓ | ✓ |
タイムリバース | ✓ | ✓ | ✓ | ✓ |
転置 | ✓ | ✓ | ✓ | ✓ |
垂直反転 | ✓ | ✓ | ✓ | ✓ |
XYマスキング | ✓ | ✓ | ✓ | ✓ |
プラットフォーム: macOS-15.0.1-arm64-arm-64bit
プロセッサ: アーム
CPU数: 10
Python バージョン: 3.12.7
画像枚数:1000枚
変換ごとの実行数: 10
最大ウォームアップ反復数: 1000
アルバム: 1.4.20
8月:1.0.0
画像: 0.4.0
コルニア: 0.7.3
トーチビジョン: 0.20.0
数値 - 単一の CPU コアで 1 秒あたりに処理される uint8 RGB イメージの数です。高いほど良いです。
変身 | アルバムメンテーション 1.4.20 | 醜い 1.0.0 | 画像 0.4.0 | コルニア 0.7.3 | トーチビジョン 0.20.0 |
---|---|---|---|---|---|
水平反転 | 8618±1233 | 4807±818 | 6042±788 | 390±106 | 914±67 |
垂直反転 | 22847±2031 | 9153±1291 | 10931±1844 | 1212±402 | 3198±200 |
回転 | 1146±79 | 1119±41 | 1136±218 | 143±11 | 181±11 |
アフィン | 682±192 | - | 774±97 | 147±9 | 130±12 |
イコライズ | 892±61 | - | 581±54 | 152±19 | 479±12 |
ランダムクロップ80 | 47341±20523 | 25272±1822 | 11503±441 | 1510±230 | 32109±1241 |
シフトRGB | 2349±76 | - | 1582±65 | - | - |
サイズ変更 | 2316±166 | 611±78 | 1806±63 | 232±24 | 195±4 |
ランダムガンマ | 8675±274 | - | 2318±269 | 108±13 | - |
グレースケール | 3056±47 | 2720±932 | 1681±156 | 289±75 | 1838±130 |
ランダムな視点 | 412±38 | - | 554±22 | 86±11 | 96±5 |
ガウスブラー | 1728±89 | 242±4 | 1090±65 | 176±18 | 79±3 |
メディアンブラー | 868±60 | - | 813±30 | 5±0 | - |
モーションブラー | 4047±67 | - | 612±18 | 73±2 | - |
ポスタリゼーション | 9094±301 | - | 2097±68 | 430±49 | 3196±185 |
Jpeg圧縮 | 918±23 | 778±5 | 459±35 | 71±3 | 625±17 |
ガウスノイズ | 166±12 | 67±2 | 206±11 | 75±1 | - |
弾性のある | 201±5 | - | 235±20 | 1±0 | 2±0 |
クラエ | 454±22 | - | 335±43 | 94±9 | - |
粗いドロップアウト | 13368±744 | - | 671±38 | 536±87 | - |
ぼかし | 5267±543 | 246±3 | 3807±325 | - | - |
カラージッター | 628±55 | 255±13 | - | 55±18 | 46±2 |
輝度 | 8956±300 | 1163±86 | - | 472±101 | 429±20 |
対比 | 8879±1426 | 736±79 | - | 425±52 | 335±35 |
ランダムサイズ変更クロップ | 2828±186 | - | - | 287±58 | 511±10 |
ノーマライズ | 1196±56 | - | - | 626±40 | 519±12 |
プランキアンジッター | 2204±385 | - | - | 813±211 | - |
リポジトリへのプル リクエストを作成するには、CONTRIBUTING.md のドキュメントに従ってください。
リンクトイン
ツイッター
不和
このライブラリが研究に役立つと思われる場合は、Albumentations: Fast and Flexible Image Augmentations を引用することを検討してください。
@Article{info11020125,AUTHOR = {Buslaev、Alexander と Iglovikov、Vladimir I. と Khvedchenya、Eugene と Parinov、Alex と Druzhinin、Mikhail と Kalinin、Alexandr A.},TITLE = {Albumentations: 高速かつ柔軟な画像拡張},JOURNAL = {情報},ボリューム = {11}、年 = {2020}、番号 = {2}、記事番号 = {125}、URL = {https://www.mdpi.com/2078-2489/11/2/125}、ISSN = {2078-2489}、DOI = {10.3390/info11020125}}