เอกสาร | ไม่ลงรอยกัน | ทวิตเตอร์ | ลิงค์อิน
Albumentations เป็นไลบรารี Python สำหรับการเพิ่มรูปภาพ การเพิ่มรูปภาพใช้ในการเรียนรู้เชิงลึกและงานคอมพิวเตอร์วิทัศน์เพื่อเพิ่มคุณภาพของโมเดลที่ผ่านการฝึกอบรม วัตถุประสงค์ของการเพิ่มภาพคือการสร้างตัวอย่างการฝึกอบรมใหม่จากข้อมูลที่มีอยู่
นี่คือตัวอย่างวิธีที่คุณสามารถใช้การเพิ่มระดับพิกเซลจากอัลบั้มอัลบั้มเพื่อสร้างภาพใหม่จากต้นฉบับ:
รองรับ Computer Vision อย่างสมบูรณ์ : ทำงานร่วมกับงาน CV ที่สำคัญทั้งหมด รวมถึงการจัดหมวดหมู่ การแบ่งส่วน (ความหมายและอินสแตนซ์) การตรวจจับวัตถุ และการประมาณค่าท่าทาง
API แบบครบวงจรที่เรียบง่าย : อินเทอร์เฟซเดียวที่สอดคล้องกันสำหรับทุกประเภทข้อมูล - รูปภาพ RGB/ระดับสีเทา/หลายสเปกตรัม มาสก์ กล่องขอบเขต และจุดสำคัญ
Rich Augmentation Library : การเสริมคุณภาพสูงมากกว่า 70 รายการเพื่อปรับปรุงข้อมูลการฝึกของคุณ
รวดเร็ว : ได้รับการเปรียบเทียบอย่างต่อเนื่องว่าเป็นไลบรารี่เสริมที่เร็วที่สุด พร้อมการเพิ่มประสิทธิภาพสำหรับการใช้งานจริง
การบูรณาการการเรียนรู้เชิงลึก : ทำงานร่วมกับ PyTorch, TensorFlow และเฟรมเวิร์กอื่นๆ ส่วนหนึ่งของระบบนิเวศ PyTorch
สร้างโดยผู้เชี่ยวชาญ : สร้างโดยนักพัฒนาที่มีประสบการณ์เชิงลึกในด้านคอมพิวเตอร์วิทัศน์และการแข่งขันแมชชีนเลิร์นนิง
Albumentations ประสบความสำเร็จในการมีส่วนร่วมของนักพัฒนา เราขอขอบคุณผู้สนับสนุนของเราที่ช่วยรักษาโครงสร้างพื้นฐานของโครงการ
- ผู้สนับสนุนระดับโกลด์ |
---|
บริษัทของคุณอาจอยู่ที่นี่ |
- ผู้สนับสนุนระดับซิลเวอร์ |
---|
- ผู้สนับสนุนระดับบรอนซ์ |
---|
การสนับสนุนของคุณเป็นวิธีหนึ่งในการกล่าว "ขอบคุณ" ต่อผู้ดูแลและผู้มีส่วนร่วมที่ใช้เวลาว่างในการสร้างและดูแลรักษาอัลบัม มีผู้สนับสนุนอยู่ในเว็บไซต์และ README ของเรา ดูระดับการสนับสนุนบนผู้สนับสนุน GitHub
อัลบัม
ข้อมูลระบบ
พารามิเตอร์มาตรฐาน
เวอร์ชันห้องสมุด
การแบ่งส่วนความหมายบนชุดข้อมูล Inria
การถ่ายภาพทางการแพทย์
การตรวจจับวัตถุและการแบ่งส่วนความหมายบนชุดข้อมูล Mapillary Vistas
การเสริมจุดสำคัญ
การแปลงระดับพิกเซล
การเปลี่ยนแปลงระดับเชิงพื้นที่
ดูเพิ่มเติม
ฉันใหม่กับการเสริมภาพ
ฉันต้องการใช้การแบ่งอัลบั้มสำหรับงานเฉพาะ เช่น การจำแนกประเภทหรือการแบ่งส่วน
ฉันต้องการทราบวิธีใช้ Albumentations กับเฟรมเวิร์กการเรียนรู้เชิงลึก
ฉันต้องการสำรวจการเสริมและดูการทำงานของอัลบัม
ผู้ดูแลปัจจุบัน
สมาชิกในทีมหลักกิตติมศักดิ์
- ร่วมเป็นสปอนเซอร์
ทำไมต้องทำอัลบูเมนชั่น
โครงการขับเคลื่อนโดยชุมชน สนับสนุนโดย
สารบัญ
ผู้เขียน
การติดตั้ง
เอกสารประกอบ
ตัวอย่างง่ายๆ
เริ่มต้นใช้งาน
ใครบ้างที่กำลังใช้ยาอัลบูเมนเทชั่น
รายการเสริม
ตัวอย่าง การเสริม เพิ่มเติมบางส่วน
ผลลัพธ์การเปรียบเทียบ
การเปรียบเทียบประสิทธิภาพ
มีส่วนร่วม
ชุมชน
การอ้างอิง
Vladimir I. Iglovikov | แก๊กเกิล แกรนด์มาสเตอร์
มิคาอิล ดรูซินิน | ผู้เชี่ยวชาญเรื่อง Kaggle
อเล็กซ์ ปารินอฟ | อาจารย์คังเกิล
อเล็กซานเดอร์ บุสเลฟ | อาจารย์คังเกิล
ยูจีน Khvedchenya | แก๊กเกิล แกรนด์มาสเตอร์
อัลบัมต้องใช้ Python 3.9 หรือสูงกว่า วิธีติดตั้งเวอร์ชันล่าสุดจาก PyPI:
pip install -U การทำอัลบัม
ตัวเลือกการติดตั้งอื่นๆ มีอธิบายไว้ในเอกสารประกอบ
เอกสารฉบับเต็มมีอยู่ที่ https://albumentations.ai/docs/
นำเข้าอัลบั้มเป็น Aimport cv2# ประกาศการแปลงไปป์ไลน์เสริม = A.Compose([A.RandomCrop(width=256, height=256),A.HorizontalFlip(p=0.5),A.RandomBrightnessContrast(p=0.2) ])# อ่านรูปภาพด้วย OpenCV และแปลงเป็น RGB colorspaceimage = cv2.imread("image.jpg")image = cv2.cvtColor(image, cv2.COLOR_BGR2RGB)# Augment an imagetransformed = แปลง(image=image)transformed_image = แปลงร่างแล้ว["รูปภาพ"]
โปรดเริ่มต้นด้วยบทความแนะนำว่าทำไมการเสริมภาพจึงมีความสำคัญ และจะช่วยในการสร้างแบบจำลองที่ดีขึ้นได้อย่างไร
หากคุณต้องการใช้การแบ่งอัลบั้มสำหรับงานเฉพาะ เช่น การจัดหมวดหมู่ การแบ่งส่วน หรือการตรวจจับวัตถุ โปรดดูชุดบทความที่มีคำอธิบายเชิงลึกของงานนี้ นอกจากนี้เรายังมีรายการตัวอย่างการใช้ Albumentations สำหรับกรณีการใช้งานที่แตกต่างกันอีกด้วย
เรามีตัวอย่างการใช้ Albumentations ร่วมกับ PyTorch และ TensorFlow
ตรวจสอบการสาธิตออนไลน์ของห้องสมุด ด้วยเครื่องมือนี้ คุณจะสามารถใช้การเสริมกับรูปภาพต่างๆ และดูผลลัพธ์ได้ นอกจากนี้เรายังมีรายการส่วนเสริมที่มีอยู่ทั้งหมดและเป้าหมายอีกด้วย
รายชื่อเอกสารที่อ้างอิงถึงอัลบัม
โครงการโอเพ่นซอร์สที่ใช้ Albumentations
การแปลงระดับพิกเซลจะเปลี่ยนเฉพาะรูปภาพอินพุต และจะทำให้เป้าหมายเพิ่มเติม เช่น มาสก์ กรอบขอบเขต และจุดสำคัญไม่เปลี่ยนแปลง รายการการแปลงระดับพิกเซล:
สารเติมแต่งเสียงรบกวน
ขั้นสูงเบลอ
คอนทราสต์อัตโนมัติ
เบลอ
แคลเฮ
ChannelDropout
สุ่มช่อง
ความคลาดเคลื่อนสี
ColorJitter
พร่ามัว
ลดระดับลง
ลายนูน
ทำให้เท่าเทียมกัน
อย
แฟนซีพีซีเอ
จากโฟลต
GaussNoise
GaussianBlur
แก้วเบลอ
ฮิสโตแกรมการจับคู่
ค่าความอิ่มตัวของสี
ไอโซนอยซ์
การส่องสว่าง
การบีบอัดภาพ
แปลงรูปภาพ
ค่ามัธยฐานเบลอ
โมชั่นเบลอ
การคูณเสียงรบกวน
ทำให้เป็นมาตรฐาน
การปรับเปลี่ยนการกระจายพิกเซล
พลังค์เคียนกระวนกระวายใจ
พลาสม่าความสว่างคอนทราสต์
พลาสม่าชาโดว์
โปสเตอร์
RGBชิฟต์
ความสว่างแบบสุ่มคอนทราสต์
สุ่มหมอก
สุ่มแกมมา
สุ่มกรวด
สุ่มฝน
สุ่มเงา
สุ่มสโนว์
สุ่มดวงอาทิตย์แฟลร์
RandomToneCurve
เสียงเรียกเข้าOvershoot
เกลือและพริกไทย
ลับคม
ช็อตนอยส์
แสงอาทิตย์
โปรยลงมา
ซูเปอร์พิกเซล
เทมเพลตการแปลง
ข้อความรูปภาพ
เพื่อลอย
ทูเกรย์
เป็น RGB
สู่ซีเปีย
UnsharpMask
ซูมเบลอ
การแปลงระดับเชิงพื้นที่จะเปลี่ยนทั้งรูปภาพอินพุตและเป้าหมายเพิ่มเติม เช่น มาสก์ กรอบขอบเขต และจุดสำคัญไปพร้อมๆ กัน ตารางต่อไปนี้แสดงเป้าหมายเพิ่มเติมใดบ้างที่ได้รับการสนับสนุนโดยการแปลงแต่ละครั้ง
แปลงร่าง | ภาพ | หน้ากาก | บีบ็อกซ์ | จุดสำคัญ |
---|---|---|---|---|
สัมพันธ์กัน | ||||
BBoxSafeRandomCrop | ||||
เซ็นเตอร์ครอป | ||||
หยาบDropout | ||||
ครอบตัด | ||||
ครอบตัดและแพด | ||||
CropNonEmptyMaskIfExists | ||||
D4 | ||||
ElasticTransform | ||||
กำลังลบ | ||||
ความถี่กำบัง | ||||
ตารางการบิดเบือน | ||||
GridDropout | ||||
GridElasticDeform | ||||
แนวนอนพลิก | ||||
แลมบ์ดา | ||||
ยาวที่สุดMaxSize | ||||
MaskDropout | ||||
สัณฐานวิทยา | ||||
ไม่อป | ||||
การบิดเบือนทางแสง | ||||
องค์ประกอบซ้อนทับ | ||||
เบาะ | ||||
ผัดถ้าจำเป็น | ||||
ทัศนคติ | ||||
PiecewiseAffine | ||||
PixelDropout | ||||
RandomCrop | ||||
RandomCropFromBorders | ||||
RandomCropNearBBox | ||||
RandomGridShuffle | ||||
RandomResizeCrop | ||||
สุ่มหมุน90 | ||||
สุ่มมาตราส่วน | ||||
RandomSizedBBoxSafeCrop | ||||
RandomSizedCrop | ||||
ปรับขนาด | ||||
หมุน | ||||
เซฟโรเตท | ||||
ShiftScaleRotate | ||||
ขนาดเล็กที่สุดMaxSize | ||||
ThinPlateSpline | ||||
การปิดบังเวลา | ||||
ย้อนเวลา | ||||
ย้าย | ||||
แนวตั้งพลิก | ||||
XYกำบัง |
แพลตฟอร์ม: macOS-15.0.1-arm64-arm-64bit
หน่วยประมวลผล: แขน
จำนวนซีพียู: 10
เวอร์ชันหลาม: 3.12.7
จำนวนภาพ: 1,000
วิ่งต่อการแปลง: 10
การอุ่นเครื่องสูงสุดซ้ำ: 1,000
อัลบั้ม: 1.4.20
สิงหาคม: 1.0.0
อิมแพ็ค: 0.4.0
คอร์เนีย: 0.7.3
การมองเห็นคบเพลิง: 0.20.0
Number - คือจำนวนอิมเมจ uint8 RGB ที่ประมวลผลต่อวินาทีบน CPU คอร์เดียว สูงกว่าจะดีกว่า
แปลงร่าง | การทำอัลบัม 1.4.20 | สิงหาคม 1.0.0 | imgaug 0.4.0 | คอร์เนีย 0.7.3 | การมองเห็นคบเพลิง 0.20.0 |
---|---|---|---|---|---|
แนวนอนพลิก | 8618 ± 1233 | 4807 ± 818 | 6042 ± 788 | 390 ± 106 | 914 ± 67 |
แนวตั้งพลิก | 22847 ± 2031 | 9153 ± 1291 | 10931 ± 1844 | 1212 ± 402 | 3198 ± 200 |
หมุน | 1146 ± 79 | 1119 ± 41 | 1136 ± 218 | 143 ± 11 | 181 ± 11 |
สัมพันธ์กัน | 682 ± 192 | - | 774 ± 97 | 147 ± 9 | 130 ± 12 |
ทำให้เท่าเทียมกัน | 892 ± 61 | - | 581 ± 54 | 152 ± 19 | 479 ± 12 |
RandomCrop80 | 47341 ± 20523 | 25272 ± 1822 | 11503 ± 441 | 1510 ± 230 | 32109 ± 1241 |
ShiftRGB | 2349 ± 76 | - | 1582 ± 65 | - | - |
ปรับขนาด | 2316 ± 166 | 611 ± 78 | 1806 ± 63 | 232 ± 24 | 195 ± 4 |
สุ่มแกมมา | 8675 ± 274 | - | 2318 ± 269 | 108 ± 13 | - |
ระดับสีเทา | 3056 ± 47 | 2720 ± 932 | 1681 ± 156 | 289 ± 75 | 1838 ± 130 |
มุมมองแบบสุ่ม | 412 ± 38 | - | 554 ± 22 | 86 ± 11 | 96 ± 5 |
GaussianBlur | 1728 ± 89 | 242 ± 4 | 1,090 ± 65 | 176 ± 18 | 79 ± 3 |
ค่ามัธยฐานเบลอ | 868 ± 60 | - | 813 ± 30 | 5 ± 0 | - |
โมชั่นเบลอ | 4047 ± 67 | - | 612 ± 18 | 73 ± 2 | - |
โปสเตอร์ | 9094 ± 301 | - | 2097 ± 68 | 430 ± 49 | 3196 ± 185 |
การบีบอัด JPEG | 918 ± 23 | 778 ± 5 | 459 ± 35 | 71 ± 3 | 625 ± 17 |
GaussianNoise | 166 ± 12 | 67 ± 2 | 206 ± 11 | 75 ± 1 | - |
ยางยืด | 201 ± 5 | - | 235 ± 20 | 1 ± 0 | 2 ± 0 |
เคลห์ | 454 ± 22 | - | 335 ± 43 | 94 ± 9 | - |
หยาบDropout | 13368 ± 744 | - | 671 ± 38 | 536 ± 87 | - |
เบลอ | 5267 ± 543 | 246 ± 3 | 3807 ± 325 | - | - |
ColorJitter | 628 ± 55 | 255 ± 13 | - | 55 ± 18 | 46 ± 2 |
ความสว่าง | 8956 ± 300 | 1163 ± 86 | - | 472 ± 101 | 429 ± 20 |
ตัดกัน | 8879 ± 1426 | 736 ± 79 | - | 425 ± 52 | 335 ± 35 |
RandomResizeCrop | 2828 ± 186 | - | - | 287 ± 58 | 511 ± 10 |
ทำให้เป็นมาตรฐาน | 1196 ± 56 | - | - | 626 ± 40 | 519 ± 12 |
แพลนเคียนกระวนกระวายใจ | 2204 ± 385 | - | - | 813 ± 211 | - |
หากต้องการสร้างคำขอดึงไปยังพื้นที่เก็บข้อมูล ให้ปฏิบัติตามเอกสารประกอบที่ CONTRIBUTING.md
ลิงค์อิน
ทวิตเตอร์
ความไม่ลงรอยกัน
หากคุณพบว่าห้องสมุดนี้มีประโยชน์สำหรับการวิจัยของคุณ โปรดพิจารณาการอ้างอิงถึงอัลบั้ม: การเพิ่มรูปภาพที่รวดเร็วและยืดหยุ่น:
@Article{info11020125,AUTHOR = {Buslaev, Alexander และ Iglovikov, Vladimir I. และ Khvedchenya, Eugene และ Parinov, Alex และ Druzhinin, Mikhail และ Kalinin, Alexandr A.},TITLE = {Albumentations: Fast and Elastic Image Augmentations},วารสาร = {ข้อมูล},ปริมาณ = {11},ปี = {2020},NUMBER = {2},หมายเลขบทความ = {125},URL = {https://www.mdpi.com/2078-2489/11/2/125},ISSN = {2078-2489},DOI = {10.3390/info11020125 }}