문서 | 불화 | 트위터 | 링크드인
Albumentations는 이미지 확대를 위한 Python 라이브러리입니다. 이미지 증강은 훈련된 모델의 품질을 높이기 위해 딥 러닝 및 컴퓨터 비전 작업에 사용됩니다. 이미지 증대의 목적은 기존 데이터에서 새로운 훈련 샘플을 생성하는 것입니다.
다음은 Albummentations의 일부 픽셀 수준 보강을 적용하여 원본 이미지에서 새 이미지를 만드는 방법에 대한 예입니다.
완전한 컴퓨터 비전 지원 : 분류, 분할(의미론 및 인스턴스), 객체 감지, 포즈 추정을 포함한 모든 주요 CV 작업에 작동합니다.
단순하고 통합된 API : RGB/회색조/다중 스펙트럼 이미지, 마스크, 경계 상자 및 키포인트 등 모든 데이터 유형에 대해 일관된 하나의 인터페이스입니다.
풍부한 증강 라이브러리 : 훈련 데이터를 향상시키는 70개 이상의 고품질 증강.
빠름 : 프로덕션 사용에 최적화되어 가장 빠른 기능 보강 라이브러리로 지속적으로 벤치마킹되었습니다.
딥 러닝 통합 : PyTorch, TensorFlow 및 기타 프레임워크와 작동합니다. PyTorch 생태계의 일부입니다.
전문가에 의해 제작됨 : 컴퓨터 비전 및 머신러닝 대회에 대한 깊은 경험을 가진 개발자가 제작했습니다.
Albummentations는 개발자의 기여를 바탕으로 성장하고 있습니다. 프로젝트 인프라를 유지하는 데 도움을 주는 후원자에게 감사드립니다.
? 골드 스폰서 |
---|
귀하의 회사가 여기에 있을 수도 있습니다. |
? 실버 스폰서 |
---|
? 브론즈 후원자 |
---|
귀하의 후원은 앨범을 만들고 유지하는 데 여가 시간을 보내는 관리자와 기여자에게 "감사합니다"라고 말하는 방법입니다. 후원자는 당사 웹사이트와 README에 소개되어 있습니다. GitHub 후원자에서 후원 등급 보기
앨범화
시스템 정보
벤치마크 매개변수
라이브러리 버전
Inria 데이터세트의 의미론적 분할
의료 영상
Mapillary Vistas 데이터세트의 객체 감지 및 의미론적 분할
키포인트 확대
픽셀 수준 변환
공간 수준 변환
또한보십시오
나는 이미지 확대를 처음 접했습니다.
분류 또는 세분화와 같은 특정 작업에 Albummentation을 사용하고 싶습니다.
딥 러닝 프레임워크에서 Albumentations를 사용하는 방법을 알고 싶습니다.
기능 보강을 탐색하고 Albummentations가 실제로 작동하는 모습을 보고 싶습니다.
현재 관리자
명예 핵심 팀원
? 후원자가 되세요
앨범을 만드는 이유
커뮤니티 중심 프로젝트, 지원자
목차
저자
설치
선적 서류 비치
간단한 예
시작하기
Albummentations를 사용하는 사람
증강 목록
증강 의 몇 가지 추가 예
벤치마킹 결과
성능 비교
기여
지역 사회
인용
블라디미르 I. 이글로비코프 | 캐글 그랜드마스터
미하일 드루지닌 | 캐글 전문가
알렉스 파리노프 | 캐글 마스터
알렉산더 부슬라예프 | 캐글 마스터
유진 크베드첸야 | 캐글 그랜드마스터
Albumentations에는 Python 3.9 이상이 필요합니다. PyPI에서 최신 버전을 설치하려면:
pip install -U 앨범화
다른 설치 옵션은 설명서에 설명되어 있습니다.
전체 문서는 https://albumentations.ai/docs/ 에서 확인할 수 있습니다.
앨범을 Aimport cv2로 가져옵니다# 보강 파이프라인 선언transform = A.Compose([A.RandomCrop(width=256, height=256),A.HorizontalFlip(p=0.5),A.RandomBrightnessContrast(p=0.2), ])# OpenCV로 이미지를 읽고 RGB 색상 공간으로 변환image = cv2.imread("image.jpg")image = cv2.cvtColor(image, cv2.COLOR_BGR2RGB)# 이미지 확대transformed = 변환(image=image)transformed_image = 변형["이미지"]
이미지 확대가 중요한 이유와 더 나은 모델을 구축하는 데 어떻게 도움이 되는지에 대한 소개 기사부터 시작하세요.
분류, 세분화 또는 개체 감지와 같은 특정 작업에 앨범 정보를 사용하려면 이 작업에 대한 자세한 설명이 있는 문서 세트를 참조하세요. 또한 다양한 사용 사례에 대한 Albummentation 적용에 대한 예 목록도 있습니다.
PyTorch 및 TensorFlow와 함께 Albumentations를 사용하는 예가 있습니다.
라이브러리의 온라인 데모를 확인하세요. 이를 통해 다양한 이미지에 증강을 적용하고 결과를 확인할 수 있습니다. 또한, 우리는 사용 가능한 모든 강화와 그 목표의 목록을 가지고 있습니다.
Albummentations를 인용한 논문 목록입니다.
Albumentations를 사용하는 오픈 소스 프로젝트.
픽셀 수준 변환은 입력 이미지만 변경하고 마스크, 경계 상자 및 키포인트와 같은 추가 대상은 변경되지 않은 상태로 유지합니다. 픽셀 수준 변환 목록은 다음과 같습니다.
첨가제노이즈
고급흐림
자동 대비
흐림
클라헤
채널드롭아웃
채널셔플
색수차
컬러지터
초점 흐림
축소
엠보싱
같게 하다
FDA
팬시PCA
FromFloat
가우스잡음
가우시안 블러
유리흐림
히스토그램 매칭
색조채도값
ISONoise
조명
이미지압축
반전Img
중앙값 흐림
모션블러
곱셈노이즈
정규화
픽셀분포적응
플랑크 지터
플라즈마밝기대비
플라즈마섀도우
포스터라이즈
RGB시프트
무작위밝기대비
무작위안개
랜덤감마
무작위자갈
무작위비
무작위그림자
무작위눈
랜덤태양플레어
무작위톤곡선
벨울림오버슈트
소금과후추
갈다
샷노이즈
솔라라이즈
튐
슈퍼픽셀
템플릿변형
텍스트 이미지
ToFloat
투그레이
ToRGB
투세피아
언샵마스크
확대/축소
공간 수준 변환은 입력 이미지와 마스크, 경계 상자, 키포인트 등의 추가 대상을 동시에 변경합니다. 다음 표에서는 각 변환에서 지원되는 추가 대상을 보여줍니다.
변환 | 영상 | 마스크 | BBox | 키포인트 |
---|---|---|---|---|
아핀 | ✓ | ✓ | ✓ | ✓ |
BBoxSafe무작위작물 | ✓ | ✓ | ✓ | ✓ |
중앙 자르기 | ✓ | ✓ | ✓ | ✓ |
거친 드롭아웃 | ✓ | ✓ | ✓ | ✓ |
수확고 | ✓ | ✓ | ✓ | ✓ |
자르기 및 패드 | ✓ | ✓ | ✓ | ✓ |
CropNonEmptyMaskIfExists | ✓ | ✓ | ✓ | ✓ |
D4 | ✓ | ✓ | ✓ | ✓ |
ElasticTransform | ✓ | ✓ | ✓ | ✓ |
지우기 | ✓ | ✓ | ✓ | ✓ |
빈도마스킹 | ✓ | ✓ | ✓ | ✓ |
그리드왜곡 | ✓ | ✓ | ✓ | ✓ |
그리드 드롭아웃 | ✓ | ✓ | ✓ | ✓ |
그리드탄성변형 | ✓ | ✓ | ✓ | ✓ |
수평뒤집기 | ✓ | ✓ | ✓ | ✓ |
람다 | ✓ | ✓ | ✓ | ✓ |
가장 긴최대 크기 | ✓ | ✓ | ✓ | ✓ |
마스크 드롭아웃 | ✓ | ✓ | ✓ | ✓ |
형태학적 | ✓ | ✓ | ✓ | ✓ |
작동 안함 | ✓ | ✓ | ✓ | ✓ |
광학왜곡 | ✓ | ✓ | ✓ | ✓ |
오버레이요소 | ✓ | ✓ | ||
인주 | ✓ | ✓ | ✓ | ✓ |
패드필요한 경우 | ✓ | ✓ | ✓ | ✓ |
관점 | ✓ | ✓ | ✓ | ✓ |
조각별아핀 | ✓ | ✓ | ✓ | ✓ |
픽셀 드롭아웃 | ✓ | ✓ | ✓ | ✓ |
무작위 자르기 | ✓ | ✓ | ✓ | ✓ |
RandomCropFromBorders | ✓ | ✓ | ✓ | ✓ |
RandomCropNearBBox | ✓ | ✓ | ✓ | ✓ |
랜덤그리드셔플 | ✓ | ✓ | ✓ | ✓ |
무작위크기조절자르기 | ✓ | ✓ | ✓ | ✓ |
무작위회전90 | ✓ | ✓ | ✓ | ✓ |
무작위 규모 | ✓ | ✓ | ✓ | ✓ |
RandomSizedBBoxSafeCrop | ✓ | ✓ | ✓ | ✓ |
임의크기자르기 | ✓ | ✓ | ✓ | ✓ |
크기 조정 | ✓ | ✓ | ✓ | ✓ |
회전 | ✓ | ✓ | ✓ | ✓ |
안전회전 | ✓ | ✓ | ✓ | ✓ |
ShiftScale회전 | ✓ | ✓ | ✓ | ✓ |
최소최대 크기 | ✓ | ✓ | ✓ | ✓ |
ThinPlateSpline | ✓ | ✓ | ✓ | ✓ |
타임마스킹 | ✓ | ✓ | ✓ | ✓ |
시간역방향 | ✓ | ✓ | ✓ | ✓ |
바꾸어 놓다 | ✓ | ✓ | ✓ | ✓ |
수직뒤집기 | ✓ | ✓ | ✓ | ✓ |
XY마스킹 | ✓ | ✓ | ✓ | ✓ |
플랫폼: macOS-15.0.1-arm64-arm-64bit
프로세서: 팔
CPU 수: 10
파이썬 버전: 3.12.7
이미지 수: 1000
변환당 실행: 10
최대 준비 반복: 1000
앨범화: 1.4.20
추악한: 1.0.0
imgaug: 0.4.0
코르니아: 0.7.3
토치비전: 0.20.0
Number - 단일 CPU 코어에서 초당 처리되는 uint8 RGB 이미지 수입니다. 높을수록 좋습니다.
변환 | 앨범 1.4.20 | 추악한 1.0.0 | 이미지 0.4.0 | 코르니아 0.7.3 | 토치비전 0.20.0 |
---|---|---|---|---|---|
수평뒤집기 | 8618 ± 1233 | 4807 ± 818 | 6042±788 | 390±106 | 914±67 |
수직뒤집기 | 22847 ± 2031 | 9153 ± 1291 | 10931 ± 1844 | 1212±402 | 3198±200 |
회전 | 1146 ± 79 | 1119 ± 41 | 1136 ± 218 | 143 ± 11 | 181 ± 11 |
아핀 | 682 ± 192 | - | 774±97 | 147 ± 9 | 130±12 |
같게 하다 | 892 ± 61 | - | 581 ± 54 | 152 ± 19 | 479 ± 12 |
RandomCrop80 | 47341 ± 20523 | 25272 ± 1822 | 11503±441 | 1510 ± 230 | 32109 ± 1241 |
ShiftRGB | 2349±76 | - | 1582 ± 65 | - | - |
크기 조정 | 2316±166 | 611±78 | 1806 ± 63 | 232±24 | 195±4 |
랜덤감마 | 8675±274 | - | 2318 ± 269 | 108 ± 13 | - |
그레이스케일 | 3056±47 | 2720±932 | 1681 ± 156 | 289±75 | 1838년 ± 130년 |
무작위관점 | 412 ± 38 | - | 554±22 | 86 ± 11 | 96 ± 5 |
가우시안 블러 | 1728 ± 89 | 242 ± 4 | 1090±65 | 176 ± 18 | 79 ± 3 |
중앙값 흐림 | 868 ± 60 | - | 813±30 | 5±0 | - |
모션블러 | 4047 ± 67 | - | 612 ± 18 | 73 ± 2 | - |
포스터라이즈 | 9094±301 | - | 2097 ± 68 | 430±49 | 3196±185 |
Jpeg압축 | 918 ± 23 | 778 ± 5 | 459±35 | 71 ± 3 | 625±17 |
가우시안 노이즈 | 166 ± 12 | 67 ± 2 | 206±11 | 75 ± 1 | - |
탄력 있는 | 201±5 | - | 235±20 | 1 ± 0 | 2 ± 0 |
클라헤 | 454±22 | - | 335±43 | 94±9 | - |
거친 드롭아웃 | 13368±744 | - | 671 ± 38 | 536 ± 87 | - |
흐림 | 5267 ± 543 | 246±3 | 3807±325 | - | - |
컬러지터 | 628 ± 55 | 255±13 | - | 55±18 | 46 ± 2 |
명도 | 8956±300 | 1163 ± 86 | - | 472±101 | 429 ± 20 |
차이 | 8879 ± 1426 | 736 ± 79 | - | 425±52 | 335±35 |
무작위크기조절자르기 | 2828±186 | - | - | 287 ± 58 | 511 ± 10 |
정규화 | 1196±56 | - | - | 626±40 | 519 ± 12 |
플랭크 지터 | 2204±385 | - | - | 813±211 | - |
저장소에 대한 풀 요청을 생성하려면 CONTRIBUTING.md의 문서를 따르십시오.
링크드인
지저귀다
불화
이 라이브러리가 연구에 유용하다고 생각되면 Albumentations: Fast and 유연한 이미지 확대를 인용하는 것을 고려해 보십시오:
@Article{info11020125,AUTHOR = {Buslaev, Alexander and Iglovikov, Vladimir I. and Khvedchenya, Eugene and Parinov, Alex and Druzhinin, Mikhail and Kalinin, Alexandr A.},TITLE = {앨범: 빠르고 유연한 이미지 확대},JOURNAL = {정보}, 볼륨 = {11}, 연도 = {2020}, 숫자 = {2},문서 번호 = {125},URL = {https://www.mdpi.com/2078-2489/11/2/125},ISSN = {2078-2489},DOI = {10.3390/info11020125 }}