apc vision toolbox Télécharger - apc vision toolbox Téléchargement du code source

apc vision toolbox

Code Source AI

1.0.0

Télécharger

Boîte à outils Vision MIT-Princeton pour l'APC 2016

Mise à jour : nous avons publié ici notre code et notre document pour notre nouveau système de vision, qui a remporté la première place dans la tâche de rangement lors de l'Amazon Robotics Challenge 2017.

Ce référentiel contient le code de la boîte à outils pour notre système de vision qui a remporté les 3e et 4e places lors de l'Amazon Picking Challenge 2016. Comprend les pilotes de capteur RGB-D Realsense (package autonome et ROS), le package ROS d'apprentissage en profondeur pour la segmentation d'objets 2D (formation et tests), Package ROS pour l’estimation de pose 6D. Il s'agit de l'implémentation de référence des modèles et du code pour notre article :

Apprentissage profond auto-supervisé multi-vues pour l'estimation de pose 6D dans le cadre du Amazon Picking Challenge (pdf, arxiv, page Web)

Andy Zeng, Kuan-Ting Yu, Shuran Song, Daniel Suo, Ed Walker Jr., Alberto Rodriguez et Jianxiong Xiao

Conférence internationale IEEE sur la robotique et l'automatisation (ICRA) 2017

L'automatisation des entrepôts a suscité un intérêt considérable ces dernières années, peut-être de manière plus visible grâce à l'Amazon Picking Challenge (APC). La réalisation d'un système de saisie et de placement entièrement autonome nécessite un système de vision robuste qui reconnaît de manière fiable les objets et leurs poses 6D. Cependant, une solution échappe au cadre de l'entrepôt en raison des environnements encombrés, de l'auto-occlusion, du bruit des capteurs et d'une grande variété d'objets. Dans cet article, nous présentons un système de vision qui a pris respectivement la 3ème et la 4ème place dans les tâches d'arrimage et de prélèvement, respectivement à l'APC 2016. Notre approche exploite les données RVB-D multi-vues et l'apprentissage auto-supervisé basé sur les données pour surmonter les difficultés évoquées ci-dessus. Plus précisément, nous segmentons et étiquetons d'abord plusieurs vues d'une scène avec un réseau neuronal entièrement convolutif, puis ajustons des modèles d'objets 3D pré-numérisés à la segmentation résultante pour obtenir la pose de l'objet 6D. La formation d'un réseau neuronal profond pour la segmentation nécessite généralement une grande quantité de données de formation avec des étiquettes manuelles. Nous proposons une méthode auto-supervisée pour générer un grand ensemble de données étiquetées sans segmentation manuelle fastidieuse qui pourrait être facilement étendue à davantage de catégories d'objets. Nous démontrons que notre système peut estimer de manière fiable la pose 6D des objets dans divers scénarios.

Taquin

Citer

Si vous trouvez ce code utile dans votre travail, pensez à citer :

@inproceedings{zeng2016multi,
  title={Multi-view Self-supervised Deep Learning for 6D Pose Estimation in the Amazon Picking Challenge},
  author={Zeng, Andy and Yu, Kuan-Ting and Song, Shuran and Suo, Daniel and Walker Jr, Ed and Rodriguez, Alberto and Xiao, Jianxiong},
  booktitle={ICRA},
  year={2016}
}

Licence

Ce code est publié sous la licence BSD simplifiée (reportez-vous au fichier LICENSE pour plus de détails).

Ensembles de données

Toutes les informations pertinentes sur les ensembles de données et les téléchargements peuvent être trouvés ici.

Contact

Si vous avez des questions ou trouvez des bugs, n'hésitez pas à me le faire savoir : Andy Zeng andyz[at]princeton[dot]edu

Table des matières

Un démarrage rapide : démo Matlab
Forfait ROS d’estimation de pose 6D
Realsense autonome
Forfait Realsense ROS
Forfait apprentissage profond FCN ROS
Entraînement FCN avec Marvin
Code d'évaluation
Outil d'annotation 3D

Un démarrage rapide : démo Matlab

Estimation des poses d'objets 6D sur les données de scène d'échantillon (dans data/sample ) avec les résultats de segmentation d'objets précalculés à partir du package Deep Learning FCN ROS :

git clone https://github.com/andyzeng/apc-vision-toolbox.git (Remarque : la taille du référentiel source est d'environ 300 Mo, le clonage peut prendre un certain temps)
cd apc-vision-toolbox/ros-packages/catkin_ws/src/pose_estimation/src/
Démarrez Matlab et exécutez mdemo

Forfait ROS d’estimation de pose 6D

Un package Matlab ROS pour estimer les poses d'objets 6D par ajustement de modèle avec ICP sur les résultats de segmentation d'objets RVB-D. Des modèles de nuages de points 3D d’objets et de bacs peuvent être trouvés ici.

Dépendances

Package Deep Learning FCN ROS et toutes ses dépendances respectives.
Matlab 2015b ou version ultérieure

Compilation

Copiez le package ROS ros_packages/.../pose_estimation dans le répertoire source de votre espace de travail catkin (par exemple catkin_ws/src )
Suivez les instructions en haut de pose_estimation/src/make.m pour compiler les messages personnalisés ROS pour Matlab
Compilez une fonction noyau GPU CUDA dans pose_estimation/src :

nvcc -ptx KNNSearch.cu

Usage

Démarrer roscore
Pour démarrer le service d'estimation de pose, exécutez pose_estimation/src/startService.m . A chaque appel (voir format de demande de service décrit dans pose_estimation/srv/EstimateObjectPose.srv ), le service :
Calibre les poses de caméra de la scène à l'aide des données d'étalonnage
Effectuer une soustraction d'arrière-plan 3D
Pour chaque objet de la scène, utilisez l'ajustement du modèle pour estimer sa pose 6D

Démo

Installez toutes les dépendances et compilez ce package
Démarrer roscore dans le terminal
Créez un répertoire temporaire qui sera utilisé par marvin_convnet pour lire les données RVB-D et enregistrer les masques de segmentation

mkdir /path/to/your/data/tmp

rosrun marvin_convnet detect _read_directory:="/path/to/your/data/tmp"
Accédez à pose_estimation/src
Modifiez les chemins de fichiers et les options en haut de demo.m
Ouvrez Matlab et exécutez :

startService.m
demo.m

Realsense autonome

Un exécutable C++ autonome pour diffuser et capturer des données (images RVB-D et nuages de points 3D) en temps réel à l'aide de librealsense. Testé sur Ubuntu 14.04 et 16.04 avec une caméra Intel® RealSense™ F200.

Voir realsense_standalone

Dépendances

librealsense v1 (important : ce code ne fonctionne qu'avec librealsense version 1 - les instructions d'installation peuvent être trouvées ici)

Installer avec le backend Video4Linux

OpenCV (testé avec OpenCV 3.1)

Utilisé pour enregistrer des images

Compilation

 cd realsense_standalone
./compile.sh

Usage

Après la compilation, exécutez ./stream pour commencer à diffuser des images RVB-D à partir du périphérique Realsense. Pendant que la fenêtre de flux est active, appuyez sur la touche de la barre d'espace pour capturer et enregistrer l'image RVB-D actuelle sur le disque. Les informations pertinentes sur la caméra et les images RVB-D capturées sont enregistrées dans un dossier nommé de manière aléatoire sous data .

Si votre appareil Realsense est branché mais n'est pas détecté, essayez d'utiliser un autre port USB. Si cela échoue, exécutez le script suivant pendant que l'appareil est débranché pour actualiser vos ports USB :

sudo ./scripts/resetUSBports.sh

Forfait Realsense ROS

Un package C++ ROS pour diffuser et capturer des données (images RVB-D et nuages de points 3D) en temps réel à l'aide de librealsense. Testé sur Ubuntu 14.04 et 16.04 avec une caméra Intel® RealSense™ F200.

Ces packages ROS sont disponibles en deux versions différentes. La version installée dépendra des logiciels disponibles sur votre système :

Version n°1 : renvoie uniquement les données de trame RVB-D sur les appels de service (ne nécessite pas OpenCV ou PCL)
Version n°2 : renvoie les données d'image RVB-D sur les appels de service et publie des nuages de points 3D (nécessite OpenCV et PCL)

Voir ros-packages/realsense_camera

Dépendances

librealsense v1 (important : ce code ne fonctionne qu'avec librealsense version 1 - les instructions d'installation peuvent être trouvées ici)

Installer avec le backend Video4Linux

[Facultatif] OpenCV (testé avec OpenCV 2.4.11)

Utilisé pour enregistrer des images

[Facultatif] Bibliothèque de nuages de points (testée avec PCL 1.7.1)

Utilisé pour enregistrer les nuages de points

Compilation

Copiez le package ROS ros_packages/.../realsense_camera dans le répertoire source de votre espace de travail catkin (par exemple catkin_ws/src )
Si nécessaire, configurez realsense_camera/CMakeLists.txt en fonction de vos dépendances respectives
Dans votre espace de travail catkin, compilez le package avec catkin_make
Source devel/setup.sh

Usage

Démarrer roscore
Pour démarrer le service de capture de données RVB-D et diffuser les données du capteur, exécutez :

rosrun realsense_camera capture

Le service /realsense_camera renvoie les données du capteur (format de données de réponse décrit dans realsense_camera/srv/StreamSensor.srv )
Si vous avez besoin d'une fenêtre GL pour voir les données RVB-D diffusées, exécutez rosrun realsense_camera capture _display:=True

Forfait apprentissage profond FCN ROS

Un package C++ ROS pour la segmentation d'objets basée sur l'apprentissage profond à l'aide de FCN (Fully Convolutional Networks) avec Marvin, un cadre de réseau neuronal léger uniquement GPU. Ce package transmet les données RVB-D via un ConvNet pré-entraîné pour récupérer les résultats de segmentation d'objets. Les réseaux de neurones sont entraînés hors ligne avec Marvin (voir Formation FCN avec Marvin).

Voir ros-packages/marvin_convnet

Dépendances

Le package Realsense ROS doit d’abord être compilé.
CUDA 7.5 et cuDNN 5. Vous devrez peut-être vous inscrire auprès de NVIDIA. Vous trouverez ci-dessous quelques étapes supplémentaires pour configurer cuDNN 5. REMARQUE Nous vous recommandons fortement d'installer différentes versions de cuDNN dans différents répertoires (par exemple, /usr/local/cudnn/vXX ) car différents progiciels peuvent nécessiter différentes versions.

LIB_DIR=lib $( [[ $( uname ) == " Linux " ]] && echo 64 )
CUDNN_LIB_DIR=/usr/local/cudnn/v5/ $LIB_DIR
echo LD_LIBRARY_PATH= $LD_LIBRARY_PATH : $CUDNN_LIB_DIR >> ~ /.profile && ~ /.profile

tar zxvf cudnn * .tgz
sudo cp cuda/ $LIB_DIR / * $CUDNN_LIB_DIR /
sudo cp cuda/include/ * /usr/local/cudnn/v5/include/

OpenCV (testé avec OpenCV 2.4.11)

Utilisé pour enregistrer des images

Compilation

Copiez le package ROS ros_packages/.../marvin_convnet dans le répertoire source de votre espace de travail catkin (par exemple catkin_ws/src )
Si nécessaire, configurez realsense_camera/CMakeLists.txt en fonction de vos dépendances respectives
Dans votre espace de travail catkin, compilez le package avec catkin_make
Source devel/setup.sh

Usage

Accédez à ros_packages/.../marvin_convnet/models/competition/ et exécutez le script bash ./download_weights.sh pour télécharger nos poids entraînés pour la segmentation d'objets (entraînés sur notre ensemble de données d'entraînement)
Edit marvin_convnet/src/detect.cu : Vers le haut du fichier, spécifiez le chemin d'accès au fichier .json de l'architecture réseau et aux poids .marvin.
Créez un dossier appelé tmp dans apc-vision-toolbox/data (par exemple apc-vision-toolbox/data/tmp ). C'est là que marvin_convnet lira/écrira les données RVB-D. Le format des données en tmp suit le format des scènes de nos ensembles de données et le format des données enregistrées par Realsense Standalone.
marvin_convnet propose deux services : save_images et detect . Le premier récupère les données RVB-D du package Realsense ROS et écrit sur le disque dans le dossier tmp , tandis que le second lit à partir du disque dans le dossier tmp et transmet les données RVB-D via le FCN et enregistre les images de réponse sur le disque.
Pour démarrer le service de sauvegarde des données RGB-D, exécutez :

rosrun marvin_convnet save_images _write_directory:= " /path/to/your/data/tmp " _camera_service_name:= " /realsense_camera "

Pour démarrer le service FCN, exécutez :

rosrun marvin_convnet detect _read_directory:= " /path/to/your/data/tmp " _service_name:= " /marvin_convnet "

Exemple d'appel de service ROS pour effectuer une segmentation d'objets pour une bouteille de colle et une boîte de marqueur d'exposition (en supposant que les données RVB-D de la scène se trouvent dans le dossier tmp ) :

rosservice call /marvin_convnet [ " elmers_washable_no_run_school_glue " , " expo_dry_erase_board_eraser " ] 0 0

Entraînement FCN avec Marvin

Code et modèles pour la formation à la segmentation d'objets à l'aide de FCN (Fully Convolutional Networks) avec Marvin, un cadre de réseau neuronal léger uniquement GPU. Comprend des fichiers .json d'architecture réseau dans convnet-training/models et une couche de données Marvin dans convnet-training/apc.hpp qui échantillonne de manière aléatoire des images RVB-D (RVB et HHA) à partir de notre ensemble de données de formation à la segmentation.

Voir convnet-training

Dépendances

CUDA 7.5 et cuDNN 5. Vous devrez peut-être vous inscrire auprès de NVIDIA. Vous trouverez ci-dessous quelques étapes supplémentaires pour configurer cuDNN 5. REMARQUE Nous vous recommandons fortement d'installer différentes versions de cuDNN dans différents répertoires (par exemple, /usr/local/cudnn/vXX ) car différents progiciels peuvent nécessiter différentes versions.

LIB_DIR=lib $( [[ $( uname ) == " Linux " ]] && echo 64 )
CUDNN_LIB_DIR=/usr/local/cudnn/v5/ $LIB_DIR
echo LD_LIBRARY_PATH= $LD_LIBRARY_PATH : $CUDNN_LIB_DIR >> ~ /.profile && ~ /.profile

tar zxvf cudnn * .tgz
sudo cp cuda/ $LIB_DIR / * $CUDNN_LIB_DIR /
sudo cp cuda/include/ * /usr/local/cudnn/v5/include/

OpenCV (testé avec OpenCV 2.4.11)

Utilisé pour lire des images

Instructions de configuration

Téléchargez notre ensemble de données de formation à la segmentation
Accédez au répertoire convnet-training/
Spécifiez le chemin du fichier de l'ensemble de données de formation dans la couche APCData de l'architecture réseau dans models/train_shelf_color.json
Accédez à models/weights/ et exécutez le script bash ./download_weights.sh pour télécharger les poids pré-entraînés VGG sur ImageNet (voir Marvin pour plus de poids pré-entraînés)
Accédez à convnet-training/ et exécutez dans le terminal ./compile.sh pour compiler Marvin.
Exécutez dans le terminal ./marvin train models/rgb-fcn/train_shelf_color.json models/weights/vgg16_imagenet_half.marvin pour entraîner un modèle de segmentation sur les données RVB-D avec des objets dans l'étagère (pour les objets dans le fourre-tout, utilisez models/rgb-fcn/train_shelf_color.json ).

Code d'évaluation

Code utilisé pour réaliser les expériences dans notre article ; teste le système de vision complète sur l'ensemble de données de référence « Shelf & Tote ».

Voir evaluation

Instructions de configuration

Téléchargez notre ensemble de données de référence « Shelf & Tote » à partir d'ici et extrayez son contenu dans apc-vision-toolbox/data/benchmark (par exemple apc-vision-toolbox/data/benchmark/office , `apc-vision-toolbox/data/benchmark/ entrepôt', etc.)
Dans evaluation/getError.m , modifiez la variable benchmarkPath pour qu'elle pointe vers le chemin d'accès du répertoire de votre ensemble de données de référence.
Nous avons fourni les prédictions de notre système de vision dans un fichier Matlab .mat enregistré evaluation/predictions.mat . Pour calculer l'exactitude de ces prédictions par rapport aux étiquettes de vérité terrain de l'ensemble de données de référence « Shelf & Tote », exécutez evaluation/getError.m

Outil d'annotation 3D

Un outil en ligne basé sur WebGL pour annoter les poses d'objets 6D de vérité terrain sur des données RVB-D. Suit une implémentation de RGB-D Annotator avec de petits changements. Voici un lien de téléchargement vers notre copie exacte de l'annotateur.

Développer

Informations supplémentaires

Version 1.0.0
Type Code Source AI
Date de mise à jour 2025-01-28
taille 141.08MB
Provenant de Github

Applications connexes

GitHub sgrebnov/cordova plugin background download

2024-11-05
Wa ch navra maza navsacha 2 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-03
Switch Toolbox

2024-11-02
Wa ch the greatest of all time 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-02
wolfs 2024 f llmo ie f lmyz lla dow load ree 7 0p 4 0p a d 10 0p

2024-11-01
Application ToolBox Xiaobaidian

2023-06-28

Recommandé pour vous

chat.petals.dev

Autre code source

1.0.0
GPT Prompt Templates

Autre code source

1.0.0
GPTyped

Autre code source

GPTyped 1.0.5
node telegram bot api

Code Source AI

v0.50.0
typebot.io

Code Source AI

v3.1.2
python wechaty getting started

Code Source AI

1.0.0
waymo open dataset

Autre code source

December 2023 Update
termwind

Autres catégories

v2.3.0
wp functions

Autres catégories

1.0.0

Actualités connexes Tout