文檔 |不和諧|推特 |領英
albumentations 是一個用於影像增強的 Python 函式庫。影像增強用於深度學習和電腦視覺任務,以提高訓練模型的品質。影像增強的目的是從現有資料創建新的訓練樣本。
以下是一個範例,說明如何應用 Albumentations 中的一些像素級增強來從原始映像建立新映像:
完整的電腦視覺支援:適用於所有主要的 CV 任務,包括分類、分割(語義和實例)、物件偵測和姿勢估計。
簡單、統一的 API :適用於所有資料類型的一致介面 - RGB/灰階/多光譜影像、遮罩、邊界框和關鍵點。
豐富的增強庫:70 多個高品質增強,可增強您的訓練資料。
快速:始終被評為最快的增強庫,並針對生產使用進行了最佳化。
深度學習整合:可與 PyTorch、TensorFlow 和其他框架搭配使用。 PyTorch 生態系的一部分。
由專家創建:由在電腦視覺和機器學習競賽方面擁有豐富經驗的開發人員建構。
專輯的蓬勃發展依賴於開發者的貢獻。我們感謝贊助商幫助維持該計畫的基礎設施。
?金牌贊助商 |
---|
您的公司可能在這裡 |
?銀牌贊助商 |
---|
?銅牌贊助商 |
---|
您的贊助是向花費空閒時間構建和維護專輯的維護者和貢獻者說“謝謝”的一種方式。贊助商在我們的網站和自述文件中都有介紹。在 GitHub Sponsors 上查看贊助級別
蛋白表達
系統資訊
基準參數
庫版本
Inria 資料集上的語意分割
醫學影像
Mapillary Vistas 資料集上的物件偵測和語意分割
關鍵點增強
像素級變換
空間級變換
參見
我是影像增強新手
我想使用 Albumentations 來執行特定任務,例如分類或分割
我想知道如何將Albumentations與深度學習框架結合使用
我想探索增強功能並了解專輯的實際應用
目前維護者
名譽核心團隊成員
?成為贊助商
為什麼選擇專輯
社區驅動的項目,支持者
目錄
作者
安裝
文件
一個簡單的例子
入門
誰在使用專輯
增強列表
再舉幾個增強的例子
基準測試結果
效能比較
貢獻
社群
引用
弗拉基米爾·伊格洛維科夫| Kaggle大師
米哈伊爾·德魯日寧| Kaggle 專家
亞歷克斯·帕里諾夫|卡格大師
亞歷山大·布斯拉耶夫|卡格大師
尤金·赫維琴亞| Kaggle大師
專輯需要 Python 3.9 或更高版本。若要從 PyPI 安裝最新版本:
pip install -U 專輯
其他安裝選項在文件中進行了描述。
完整文件可在https://albumentations.ai/docs/取得。
import albumentations as Aimport cv2# 宣告一個增強管道transform = A.Compose([A.RandomCrop(width=256, height=256),A.HorizontalFlip(p=0.5),A.RandomBrightnessContrast(p=0.2) , ])# 使用OpenCV 讀取影像並轉換為RGB 色彩空間image = cv2.imread("image.jpg")image = cv2.cvtColor(image, cv2.COLOR_BGR2RGB)# 增強影像transformed = transform(image=image )transformed_image = 變換後的[“圖像”]
請從介紹文章開始,了解為什麼影像增強很重要以及它如何幫助建立更好的模型。
如果您想將 Albumentations 用於特定任務(例如分類、分割或物件偵測),請參閱對此任務進行深入描述的文章集。我們還有一個針對不同用例應用專輯的範例清單。
我們有使用 Albumentations 以及 PyTorch 和 TensorFlow 的範例。
查看該庫的線上演示。有了它,您可以將增強應用到不同的圖像並查看結果。此外,我們還有所有可用增強功能及其目標的清單。
引用Albumentations 的論文列表。
使用Albumentations 的開源專案。
像素級變換將僅更改輸入影像,並將保留任何其他目標(例如遮罩、邊界框和關鍵點)不變。像素級變換列表:
加性噪音
高級模糊
自動對比
模糊
克拉赫
通道遺失
頻道隨機播放
色差
色彩抖動
散焦
縮小規模
浮雕
均衡
美國食品藥物管理局
花式PCA
來自浮動
高斯雜訊
高斯模糊
玻璃模糊
直方圖匹配
色相飽和度值
ISO噪音
照明
影像壓縮
反轉影像
中位數模糊
運動模糊
乘性噪音
標準化
像素分佈適應
普朗克抖動
等離子亮度對比度
等離子陰影
色調分離
RGB偏移
隨機亮度對比
隨機霧
隨機伽瑪
隨機礫石
隨機雨
隨機陰影
隨機雪
隨機太陽耀斑
隨機色調曲線
振鈴過衝
鹽和胡椒
銳化
散粒噪音
曬太陽
濺
超像素
模板轉換
文字影像
浮動
至格雷
轉RGB
至棕褐色
銳利化蒙版
變焦模糊
空間級變換將同時更改輸入影像以及其他目標,例如遮罩、邊界框和關鍵點。下表顯示了每個轉換支援哪些附加目標。
轉換 | 影像 | 面具 | B盒 | 重點 |
---|---|---|---|---|
仿射 | ✓ | ✓ | ✓ | ✓ |
BBoxSafeRandomCrop | ✓ | ✓ | ✓ | ✓ |
中心作物 | ✓ | ✓ | ✓ | ✓ |
粗略輟學 | ✓ | ✓ | ✓ | ✓ |
莊稼 | ✓ | ✓ | ✓ | ✓ |
作物和墊 | ✓ | ✓ | ✓ | ✓ |
CropNonEmptyMaskIfExists | ✓ | ✓ | ✓ | ✓ |
D4 | ✓ | ✓ | ✓ | ✓ |
彈性變換 | ✓ | ✓ | ✓ | ✓ |
擦除 | ✓ | ✓ | ✓ | ✓ |
頻率掩蔽 | ✓ | ✓ | ✓ | ✓ |
網格畸變 | ✓ | ✓ | ✓ | ✓ |
網格遺失 | ✓ | ✓ | ✓ | ✓ |
網格彈性變形 | ✓ | ✓ | ✓ | ✓ |
水平翻轉 | ✓ | ✓ | ✓ | ✓ |
拉姆達 | ✓ | ✓ | ✓ | ✓ |
最長最大尺寸 | ✓ | ✓ | ✓ | ✓ |
遮罩遺失 | ✓ | ✓ | ✓ | ✓ |
形態學 | ✓ | ✓ | ✓ | ✓ |
無操作 | ✓ | ✓ | ✓ | ✓ |
光學畸變 | ✓ | ✓ | ✓ | ✓ |
覆蓋元素 | ✓ | ✓ | ||
軟墊 | ✓ | ✓ | ✓ | ✓ |
如果需要則填充 | ✓ | ✓ | ✓ | ✓ |
看法 | ✓ | ✓ | ✓ | ✓ |
分段仿射 | ✓ | ✓ | ✓ | ✓ |
像素遺失 | ✓ | ✓ | ✓ | ✓ |
隨機裁剪 | ✓ | ✓ | ✓ | ✓ |
從邊界隨機裁剪 | ✓ | ✓ | ✓ | ✓ |
近框隨機裁剪 | ✓ | ✓ | ✓ | ✓ |
隨機網格洗牌 | ✓ | ✓ | ✓ | ✓ |
隨機調整大小裁剪 | ✓ | ✓ | ✓ | ✓ |
隨機旋轉90 | ✓ | ✓ | ✓ | ✓ |
隨機尺度 | ✓ | ✓ | ✓ | ✓ |
RandomSizedBBoxSafeCrop | ✓ | ✓ | ✓ | ✓ |
隨機大小裁剪 | ✓ | ✓ | ✓ | ✓ |
調整大小 | ✓ | ✓ | ✓ | ✓ |
旋轉 | ✓ | ✓ | ✓ | ✓ |
安全旋轉 | ✓ | ✓ | ✓ | ✓ |
平移縮放旋轉 | ✓ | ✓ | ✓ | ✓ |
最小最大尺寸 | ✓ | ✓ | ✓ | ✓ |
薄板樣條 | ✓ | ✓ | ✓ | ✓ |
時間掩蔽 | ✓ | ✓ | ✓ | ✓ |
時間倒轉 | ✓ | ✓ | ✓ | ✓ |
轉置 | ✓ | ✓ | ✓ | ✓ |
垂直翻轉 | ✓ | ✓ | ✓ | ✓ |
XY遮蔽 | ✓ | ✓ | ✓ | ✓ |
平台:macOS-15.0.1-arm64-arm-64bit
處理器:ARM
CPU 數量:10
Python版本:3.12.7
圖片數量:1000
每次轉換運行:10
最大預熱迭代:1000
蛋白:1.4.20
八月:1.0.0
圖:0.4.0
科尼亞:0.7.3
火炬視覺:0.20.0
Number - 是單一 CPU 核心每秒處理的 uint8 RGB 影像的數量。越高越好。
轉換 | 蛋白表達 1.4.20 | 醜陋的 1.0.0 | 伊姆高格 0.4.0 | 科爾尼亞 0.7.3 | 火炬視覺 0.20.0 |
---|---|---|---|---|---|
水平翻轉 | 8618±1233 | 4807±818 | 6042±788 | 390±106 | 914±67 |
垂直翻轉 | 22847 ± 2031 | 9153±1291 | 10931±1844 | 1212±402 | 3198±200 |
旋轉 | 1146±79 | 1119±41 | 1136±218 | 143±11 | 181±11 |
仿射 | 682±192 | - | 774±97 | 147±9 | 130±12 |
均衡 | 892±61 | - | 581±54 | 152±19 | 479±12 |
隨機裁剪80 | 47341±20523 | 25272±1822 | 11503±441 | 1510±230 | 32109±1241 |
改變RGB | 2349±76 | - | 1582±65 | - | - |
調整大小 | 2316±166 | 611±78 | 1806±63 | 232±24 | 195±4 |
隨機伽瑪 | 8675±274 | - | 2318 ± 269 | 108±13 | - |
灰階 | 3056±47 | 2720±932 | 1681±156 | 289±75 | 1838±130 |
隨機視角 | 412±38 | - | 554±22 | 86±11 | 96±5 |
高斯模糊 | 1728 ± 89 | 242±4 | 1090±65 | 176±18 | 79±3 |
中位數模糊 | 868±60 | - | 813±30 | 5±0 | - |
運動模糊 | 4047±67 | - | 612±18 | 73±2 | - |
色調分離 | 9094±301 | - | 2097±68 | 430±49 | 3196±185 |
Jpeg壓縮 | 918±23 | 778±5 | 459±35 | 71±3 | 625±17 |
高斯雜訊 | 166±12 | 67±2 | 206±11 | 75±1 | - |
鬆緊帶 | 201±5 | - | 235±20 | 1±0 | 2±0 |
克拉埃 | 454±22 | - | 335±43 | 94±9 | - |
粗略輟學 | 13368±744 | - | 671±38 | 536±87 | - |
模糊 | 5267±543 | 246±3 | 3807±325 | - | - |
色彩抖動 | 628±55 | 255±13 | - | 55±18 | 46±2 |
亮度 | 8956±300 | 1163±86 | - | 472±101 | 429±20 |
對比 | 8879±1426 | 736±79 | - | 425±52 | 335±35 |
隨機調整大小裁剪 | 2828±186 | - | - | 287±58 | 511±10 |
標準化 | 1196±56 | - | - | 626±40 | 519±12 |
普朗克抖動 | 2204±385 | - | - | 813±211 | - |
若要建立對儲存庫的拉取請求,請依照 CONTRIBUTING.md 中的文件進行操作
領英
嘰嘰喳喳
不和諧
如果您發現該庫對您的研究有用,請考慮引用Albumentations:快速靈活的圖像增強:
@Article{info11020125,作者 = {Buslaev、Alexander 和 Iglovikov、Vladimir I. 和 Khvedchenya、Eugene 和 Parinov、Alex 和 Druzhinin、Mikhail 和 Kalinin、Alexandr A.},TITLE = {Albumentations:快速靈活的圖像增強},期刊= {資訊},卷= {11},年份= {2020},編號= {2},文章編號= {125},URL = {https://www.mdpi.com/2078-2489/11/ 2 /125},ISSN = {2078-2489},DOI = {10.3390/info11020125}}