Objekterkennung und Instanzsegmentierung sind mit Abstand die wichtigsten Anwendungen im Computer Vision. Allerdings muss die Erkennung kleiner Objekte und die Schlussfolgerung auf große Bilder im praktischen Einsatz noch verbessert werden. Hier kommt das SAHI, um Entwicklern dabei zu helfen, diese realen Probleme mit vielen Vision-Dienstprogrammen zu überwinden.
Befehl | Beschreibung |
---|---|
vorhersagen | Führen Sie eine Sliced-/Standard-Video-/Bildvorhersage mit einem beliebigen Ultralytics/mmdet/detectron2/huggingface/torchvision-Modell durch |
Vorhersage-einundfünfzig | Führen Sie eine Sliced-/Standard-Vorhersage mit einem beliebigen Ultralytics/mmdet/detectron2/huggingface/torchvision-Modell durch und erkunden Sie die Ergebnisse in der Fiftyone-App |
Kokosscheibe | Schneiden Sie COCO-Anmerkungen und Bilddateien automatisch in Scheiben |
Coco einundfünfzig | Erkunden Sie mehrere Vorhersageergebnisse in Ihrem COCO-Datensatz mit einundfünfzig Benutzeroberflächen, geordnet nach der Anzahl der Fehlerkennungen |
Coco bewerten | Bewerten Sie klassenweise COCO AP und AR für gegebene Vorhersagen und Grundwahrheit |
Kokos analysieren | Berechnen und exportieren Sie viele Fehleranalysediagramme |
Kokos-Eigelb5 | Konvertieren Sie jeden COCO-Datensatz automatisch in das Ultralytics-Format |
Liste der Publikationen, die SAHI zitieren (derzeit über 200)
? Liste der Gewinner des Wettbewerbs, die SAHI verwendet haben
Einführung in SAHI
Offizieller Vortrag (ICIP 2022 mündlich)
Vorab trainierte Gewichte und ICIP 2022-Papierdateien
Visualisieren und Auswerten von SAHI-Vorhersagen mit FiftyOne (2024) (NEU)
Forschungsartikel „Exploring SAHI“ von „learnopencv.com“
„VIDEO-TUTORIAL: Slicing-gestützte Hyperinferenz zur Erkennung kleiner Objekte – SAHI“ (EMPFOHLEN)
Die Videoinferenzunterstützung ist live
Kaggle-Notizbuch
Erkennung von Satellitenobjekten
Fehleranalysediagramme und -auswertung (EMPFOHLEN)
Interaktive Ergebnisvisualisierung und Inspektion (EMPFOHLEN)
COCO-Datensatzkonvertierung
Notizbuch zum Schneiden
YOLOX
+ SAHI
-Demo: (EMPFOHLEN)
Komplettlösung RT-DETR
+ SAHI
: (NEU)
Komplettlösung YOLOv8
+ SAHI
:
Komplettlösung DeepSparse
+ SAHI
:
HuggingFace
+ SAHI
-Komplettlösung:
Komplettlösung YOLOv5
+ SAHI
:
Komplettlösung MMDetection
+ SAHI
:
Komplettlösung Detectron2
+ SAHI
:
Komplettlösung TorchVision
+ SAHI
:
sahi
mit Pip: pip install sahi
Shapely
über Conda installiert werden: conda install -c conda-forge shapely
conda install pytorch=1.10.2 torchvision=0.11.3 cudatoolkit=11.3 -c pytorch
conda install pytorch=1.13.1 torchvision=0.14.1 pytorch-cuda=11.7 -c pytorch -c nvidia
pip install yolov5==7.0.13
pip install ultralytics==8.0.207
pip install mim
mim install mmdet==3.0.0
pip install detectron2 -f https://dl.fbaipublicfiles.com/detectron2/wheels/cu113/torch1.10/index.html
pip install transformers timm
pip install super-gradients==3.3.1
Ausführliche Informationen zum Befehl sahi predict
finden Sie unter cli.md.
Ausführliche Informationen zur Videoinferenz finden Sie im Videoinferenz-Tutorial.
Detaillierte Informationen zu Bild-/Datensatz-Slicing-Dienstprogrammen finden Sie unter slicing.md.
Detaillierte Informationen finden Sie unter Fehleranalysediagramme und -auswertung.
Ausführliche Informationen finden Sie unter Interaktive Ergebnisvisualisierung und -inspektion.
Detaillierte Informationen zu COCO-Dienstprogrammen (yolov5-Konvertierung, Slicing, Subsampling, Filterung, Zusammenführung, Aufteilung) finden Sie unter coco.md.
Detaillierte Informationen zu MOT-Dienstprogrammen (Erstellung von Ground-Truth-Datensätzen, Exportieren von Tracker-Metriken im Mot-Challenge-Format) finden Sie unter mot.md.
Wenn Sie dieses Paket in Ihrer Arbeit verwenden, zitieren Sie es bitte wie folgt:
@article{akyon2022sahi,
title={Slicing Aided Hyper Inference and Fine-tuning for Small Object Detection},
author={Akyon, Fatih Cagatay and Altinuc, Sinan Onur and Temizel, Alptekin},
journal={2022 IEEE International Conference on Image Processing (ICIP)},
doi={10.1109/ICIP46576.2022.9897990},
pages={966-970},
year={2022}
}
@software{obss2021sahi,
author = {Akyon, Fatih Cagatay and Cengiz, Cemil and Altinuc, Sinan Onur and Cavusoglu, Devrim and Sahin, Kadir and Eryuksel, Ogulcan},
title = {{SAHI: A lightweight vision library for performing large scale object detection and instance segmentation}},
month = nov,
year = 2021,
publisher = {Zenodo},
doi = {10.5281/zenodo.5718950},
url = {https://doi.org/10.5281/zenodo.5718950}
}
sahi
-Bibliothek unterstützt derzeit alle YOLOv5-Modelle, MMDetection-Modelle, Detectron2-Modelle und HuggingFace-Objekterkennungsmodelle. Darüber hinaus ist es einfach, neue Frameworks hinzuzufügen.
Sie müssen lediglich eine neue .py-Datei im Ordner „sahi/models/“ erstellen und in dieser .py-Datei eine neue Klasse erstellen, die die DetectionModel-Klasse implementiert. Sie können den MMDetection-Wrapper oder den YOLOv5-Wrapper als Referenz verwenden.
Bevor Sie eine PR eröffnen:
pip install -e . " [dev] "
python -m scripts.run_code_style format
Fatih Cagatay Akyon
Sinan Onur Altinuc
Devrim Cavusoglu
Cemil Cengiz
Ogulcan Eryuksel
Kadir Nar
Burak Maden
Pushpak Bhoge
M. Can V.
Christoffer Edlund
Ishwor
Mehmet Ecevit
Kadir Sahin
Wey
Youngjae
Alzbeta Tureckova
Also Uchida
Yonghye Kwon
Neville
Janne Mäyrä
Christoffer Edlund
Ilker Manap
Nguyễn Thế An
Wei Ji
Aynur Susuz
Pranav Durai
Lakshay Mehra
Karl-Joan Alesma
Jacob Marks
William Lunge
Amogh Dhaliwal