Documentação | Instalação | ? Model zoo | ? Atualizar notícias | Projetos em andamento | ? Problemas de relatório
Inglês | 简体中文
O MMDETECTION é uma caixa de ferramentas de detecção de objeto de código aberto baseado em Pytorch. Faz parte do projeto OpenMmlab.
A filial principal trabalha com o Pytorch 1.8+ .
Design modular
Decompomos a estrutura de detecção em diferentes componentes e pode -se construir facilmente uma estrutura de detecção de objetos personalizada combinando diferentes módulos.
Suporte de várias tarefas fora da caixa
A caixa de ferramentas suporta diretamente várias tarefas de detecção, como detecção de objetos , segmentação de instância , segmentação panóptica e detecção de objetos semi-supervisionada .
Alta eficiência
Todas as operações básicas de BBOX e máscara são executadas nas GPUs. A velocidade de treinamento é mais rápida que ou comparável a outras bases de código, incluindo Detectron2, Maskrcnn-Benchmark e SimpleDet.
Estado da arte
A caixa de ferramentas decorre da base de código desenvolvida pela equipe MMDET , que ganhou o Coco Detection Challenge em 2018, e continuamos empurrando -o para a frente. O recém-lançado RTMDET também obtém novos resultados de última geração na segmentação de instâncias em tempo real e nas tarefas de detecção de objetos rotacionadas e a melhor troca de precisão de parâmetro-precisão na detecção de objetos.
Além da MMDETECTION, também lançamos o MMEngine para treinamento de modelos e MMCV para pesquisa de visão computacional, que dependem fortemente por esta caixa de ferramentas.
? Lançamos os pesos pré-treinados para MM-Grounding-Dino Swin-B e Swin-L, bem-vindo a tentar dar feedback.
v3.3.0 foi lançado em 1/05/2024:
MM-Grounding-Dino: um oleoduto aberto e abrangente para aterramento e detecção de objetos unificados
O Dino de aterramento é um modelo de pré-treinamento de aterramento que unifica a detecção de objetos de vocabulário 2D em 2D e o aterramento de frases, com aplicações amplas. No entanto, sua parte de treinamento não foi de origem aberta. Portanto, propomos MM-Grounding-Dino, que não apenas serve como uma versão de replicação de código aberto do DINO de aterramento, mas também alcança uma melhoria significativa de desempenho com base em tipos de dados reconstruídos, explorando diferentes combinações de dados e estratégias de inicialização. Além disso, realizamos avaliações de múltiplas dimensões, incluindo Ood, REC, Frase Grounding, OVD e Tune Fine, para escavar completamente as vantagens e desvantagens do aterramento pré-treinamento, na esperança de fornecer inspiração para trabalhos futuros.
Código: mm_grounding_dino/readme.md
Estamos entusiasmados em anunciar nosso trabalho mais recente sobre tarefas de reconhecimento de objetos em tempo real, RTMDET , uma família de detectores de estágio único totalmente convolucionais. O RTMDET não apenas atinge a melhor troca de precisão de parâmetro na detecção de objetos de tamanhos de modelo minúsculo para extra-grande, mas também obtém um novo desempenho de última geração na segmentação de instância e nas tarefas de detecção de objetos rotacionados. Os detalhes podem ser encontrados no relatório técnico. Modelos pré-treinados estão aqui.
Tarefa | Conjunto de dados | AP | FPS (TRT FP16 BS1 3090) |
---|---|---|---|
Detecção de objetos | COCO | 52.8 | 322 |
Segmentação da instância | COCO | 44.6 | 188 |
Detecção de objeto rotacionado | Dota | 78.9 (em escala única) /81.3 (multi-escala) | 121 |
Consulte a instalação para obter instruções de instalação.
Consulte a visão geral da introdução geral da mmDetection.
Para guias de usuário detalhados e guias avançados, consulte nossa documentação:
Guias de usuário
Guias avançados
Também fornecemos o tutorial de detecção de objetos e o tutorial de segmentação de instância.
Para migrar da mmDetecção 2.x, consulte a migração.
Resultados e modelos estão disponíveis no zoológico do modelo.
Detecção de objetos | Segmentação da instância | Segmentação panóptica | Outro |
|
|
|
|
Backbones | Pescoço | Perda | Comum |
|
|
|
|
Alguns outros métodos também são suportados em projetos usando mmDetection.
Consulte as perguntas frequentes para perguntas frequentes.
Agradecemos todas as contribuições para melhorar o MMDETECTION. Projetos em andamento podem ser encontrados em projetos do GitHub. Bem -vindo aos usuários da comunidade para participar desses projetos. Consulte Contribuindo.md para obter a diretriz contribuinte.
O MMDETECTION é um projeto de código aberto que é contribuído por pesquisadores e engenheiros de várias faculdades e empresas. Agradecemos todos os colaboradores que implementam seus métodos ou adicionam novos recursos, bem como usuários que fornecem feedbacks valiosos. Desejamos que a caixa de ferramentas e a referência possam servir à crescente comunidade de pesquisa, fornecendo um kit de ferramentas flexível para reimplementar os métodos existentes e desenvolver seus novos detectores.
Se você usar esta caixa de ferramentas ou referência em sua pesquisa, cite este projeto.
@article{mmdetection,
title = {{MMDetection}: Open MMLab Detection Toolbox and Benchmark},
author = {Chen, Kai and Wang, Jiaqi and Pang, Jiangmiao and Cao, Yuhang and
Xiong, Yu and Li, Xiaoxiao and Sun, Shuyang and Feng, Wansen and
Liu, Ziwei and Xu, Jiarui and Zhang, Zheng and Cheng, Dazhi and
Zhu, Chenchen and Cheng, Tianheng and Zhao, Qijie and Li, Buyu and
Lu, Xin and Zhu, Rui and Wu, Yue and Dai, Jifeng and Wang, Jingdong
and Shi, Jianping and Ouyang, Wanli and Loy, Chen Change and Lin, Dahua},
journal= {arXiv preprint arXiv:1906.07155},
year={2019}
}
Este projeto é lançado sob a licença Apache 2.0.