Dokumentation | Installation | Modellzoo | "Update News | Laufende Projekte | Meldungsprobleme
Englisch | 简体中文
Mmdetektion ist eine Open -Source -Objekterkennungs -Toolbox, die auf Pytorch basiert. Es ist Teil des OpenMMLAB -Projekts.
Der Hauptzweig arbeitet mit Pytorch 1.8+ .
Modulares Design
Wir zersetzen das Erkennungsrahmen in verschiedene Komponenten und man kann einfach ein angepasendes Objekterkennungsrahmen durch Kombination verschiedener Module konstruieren.
Unterstützung mehrerer Aufgaben aus der Schachtel
Die Toolbox unterstützt direkt mehrere Erkennungsaufgaben wie die Objekterkennung , die Instanzsegmentierung , die panoptische Segmentierung und die semi-überprüfte Objekterkennung .
Hohe Effizienz
Alle grundlegenden Bbox- und Maskenoperationen werden auf GPUs ausgeführt. Die Trainingsgeschwindigkeit ist schneller als oder vergleichbar mit anderen Codebasen, einschließlich DETECTRON2, MASKRCNN-Benchmark und Simpledet.
Stand der Technik
Die Toolbox stammt aus der Codebase, die vom MMDET -Team entwickelt wurde, das 2018 Coco Detection Challenge gewann, und wir drängen sie weiter voran. Das neu veröffentlichte RTMDET erhält auch neue Ergebnisse der neuesten Stand der Technik zu Echtzeit-Instanzsegmentierung und rotierten Objekterkennungsaufgaben und dem besten Kompromiss der Parameterkonzern bei der Objekterkennung.
Neben der MMDetion haben wir auch Mmengine für Modelltraining und MMCV für die Computer -Vision -Forschung veröffentlicht, die stark von dieser Toolbox abhängig sind.
? Wir haben die vorgeborenen Gewichte für MM-Boden-Dino-Swin-B und Swin-L veröffentlicht.
v3.3.0 wurde in den 01.05.2024 veröffentlicht:
MM-Grounding-Dino: Eine offene und umfassende Pipeline für einheitliches Objekt Erdung und Erkennung
Das Erdungsdino ist ein Erdungmodell vor dem Training, das 2D offene Vokabularobjekterkennung und -phrase Erdung mit breiten Anwendungen vereint. Sein Trainingsteil war jedoch nicht offen. Daher schlagen wir MM-Grounding-Dino vor, das nicht nur als Open-Source-Replikationsversion von Grounding Dino dient, sondern auch eine signifikante Leistungsverbesserung auf der Grundlage rekonstruierter Datentypen erzielt und verschiedene Datensatzkombinationen und Initialisierungsstrategien untersucht. Darüber hinaus führen wir Bewertungen aus mehreren Dimensionen durch, einschließlich OOD, REC, Phrase Grounding, OVD und Fine-Tune, um die Vor- und Nachteile der Voraussetzung des Grundes vollständig auszugraben, in der Hoffnung, Inspiration für zukünftige Arbeiten zu bieten.
Code: mm_grounding_dino/readme.md
Wir freuen uns, unsere neuesten Arbeiten zu Echtzeit-Objekterkennungsaufgaben, RTMDET , einer Familie vollständig faltungsvoller einstufiger Detektoren bekannt zu geben. RTMDET erzielt nicht nur den besten Kompromiss der Parametergenauigkeit bei der Objekterkennung von winzigen bis extra-großen Modellgrößen, sondern erhält auch eine neue Leistungsleistung für die Instanzsegmentierung und die Erkennung von Objekten. Details finden Sie im technischen Bericht. Vorausgebildete Modelle sind hier.
Aufgabe | Datensatz | AP | FPS (TRT FP16 BS1 3090) |
---|---|---|---|
Objekterkennung | Coco | 52,8 | 322 |
Instanzsegmentierung | Coco | 44,6 | 188 |
Rotierte Objekterkennung | Dota | 78,9 (Einzelmaßstab) /81.3 (Mehrfachskala) | 121 |
Weitere Informationen finden Sie in der Installation für Installationsanweisungen.
Übersicht finden Sie in der allgemeinen Einführung der MMDetion.
Ausführliche Benutzerführer und fortgeschrittene Führer finden Sie in unserer Dokumentation:
Benutzerführer
Fortgeschrittene Führer
Wir bieten auch das Colab -Tutorial für Objekterkennungen und eine Instanzsegmentierung Colab Tutorial.
Um von mmdetction 2.x zu migrieren, siehe Migration.
Ergebnisse und Modelle sind im Modellzoo verfügbar.
Objekterkennung | Instanzsegmentierung | Panoptische Segmentierung | Andere |
|
|
|
|
Rückgrat | Hals | Verlust | Gemeinsam |
|
|
|
|
Einige andere Methoden werden auch in Projekten mit mmdetektion unterstützt.
Weitere Fragen finden Sie in FAQ für häufig gestellte Fragen.
Wir schätzen alle Beiträge zur Verbesserung der mmdetektion. Laufende Projekte finden Sie in Github -Projekten. Begrüßen Sie Community -Nutzern, um an diesen Projekten teilzunehmen. Weitere Informationen finden Sie in der beitragenden Richtlinie.
MMDETICETICE ist ein Open -Source -Projekt, das von Forschern und Ingenieuren verschiedener Hochschulen und Unternehmen beigetragen wird. Wir schätzen alle Mitwirkenden, die ihre Methoden implementieren oder neue Funktionen hinzufügen, sowie Benutzer, die wertvolle Feedbacks geben. Wir wünschen uns, dass die Toolbox und der Benchmark der wachsenden Forschungsgemeinschaft dienen könnten, indem sie ein flexibles Toolkit zur Neuauflagen vorhandenen Methoden bereitstellen und ihre eigenen neuen Detektoren entwickeln.
Wenn Sie diese Toolbox oder Benchmark in Ihrer Forschung verwenden, zitieren Sie dieses Projekt bitte.
@article{mmdetection,
title = {{MMDetection}: Open MMLab Detection Toolbox and Benchmark},
author = {Chen, Kai and Wang, Jiaqi and Pang, Jiangmiao and Cao, Yuhang and
Xiong, Yu and Li, Xiaoxiao and Sun, Shuyang and Feng, Wansen and
Liu, Ziwei and Xu, Jiarui and Zhang, Zheng and Cheng, Dazhi and
Zhu, Chenchen and Cheng, Tianheng and Zhao, Qijie and Li, Buyu and
Lu, Xin and Zhu, Rui and Wu, Yue and Dai, Jifeng and Wang, Jingdong
and Shi, Jianping and Ouyang, Wanli and Loy, Chen Change and Lin, Dahua},
journal= {arXiv preprint arXiv:1906.07155},
year={2019}
}
Dieses Projekt wird unter der Apache 2.0 -Lizenz veröffentlicht.