3dmatch toolboxダウンロード - 3dmatch toolboxソースコードのダウンロード

3dmatch toolbox

AI ソースコード

1.0.0

ダウンロード

3Dマッチツールボックス

3DMatch は、3D データ (点群、深度マップ、メッシュなど) を操作する ConvNet ベースのローカル幾何学的特徴記述子です。このツールボックスは、幾何学的位置合わせとキーポイントマッチングに 3DMatch を使用するコードと、既存の RGB-D 再構築から 3DMatch をトレーニングするコードを提供します。これは私たちの論文のリファレンス実装です。

3DMatch: RGB-D 再構成からの局所幾何学的記述子の学習

PDF |ウェブページ、ベンチマーク、データセット |ビデオ

アンディ・ゼン、シュラン・ソング、マティアス・ニースナー、マシュー・フィッシャー、ジャンション・シャオ、トーマス・ファンクハウザー

IEEE Conference on Computer Vision and Pattern Recognition (CVPR) 2017口頭発表

3D スキャンデータにはノイズが多く、解像度が低く、不完全な性質があるため、現実世界の深度画像上で局所的な幾何学的特徴を一致させることは困難な作業です。これらの問題により、通常は幾何学的特性に対するヒストグラムに基づく現在の最先端の方法のパフォーマンスが制限されます。この論文では、部分的な 3D データ間の対応を確立するためにローカルボリュームパッチ記述子を学習するデータ駆動型モデル 3DMatch を紹介します。モデルのトレーニングデータを蓄積するために、既存の RGB-D 再構成で見つかった何百万もの対応ラベルを活用する教師なし特徴学習方法を提案します。実験の結果、私たちの記述子は、再構築のために新しいシーンのローカルジオメトリを照合できるだけでなく、さまざまなタスクや空間スケール (Amazon Picking Challenge のインスタンスレベルのオブジェクトモデルの位置合わせやメッシュサーフェスの対応など) にも一般化できることがわかりました。結果は、3Dmatch が他の最先端のアプローチを大幅に上回るパフォーマンスを一貫して示していることを示しています。

引用

このコードが自分の仕事に役立つと思われる場合は、次のコードを引用することを検討してください。

@inproceedings{zeng20163dmatch, 
	title={3DMatch: Learning Local Geometric Descriptors from RGB-D Reconstructions}, 
	author={Zeng, Andy and Song, Shuran and Nie{ s s}ner, Matthias and Fisher, Matthew and Xiao, Jianxiong and Funkhouser, Thomas}, 
	booktitle={CVPR}, 
	year={2017} 
}

ライセンス

このコードは、Simplified BSD License に基づいてリリースされています (詳細については、LICENSE ファイルを参照してください)。

ベンチマークとデータセット

すべての関連情報とダウンロードはここからご覧いただけます。

接触

ご質問がある場合、またはバグを見つけた場合は、Andy Zeng までお知らせください。 andyz[at]princeton[dot]edu

変更ログ

2018 年 3 月 20 日更新: キーポイントマッチングベンチマークのテストセットのラベルを追加しました (便宜上)。
2017 年 11 月 2 日。バグ修正: #include <random>デモコードの utils.hpp に追加しました。
2017 年 10 月 30 日。バグ修正: トレーニング中に時折発生する NaN エラーに対する Quoc-Huy の修正が含まれました。
2017 年 10 月 28 日注意: デモコードは、単純なバイナリ形式で保存された 3D 点群のみを読み取ります。独自の点群形式で 3DMatch デモコードを実行したい場合は、demo.cu をそれに応じて変更してください。
2017 年 4 月 6 日。注意: 3DMatch は cuDNN 5.1 を使用します。インストール手順を改訂しました。

依存関係

3DMatch のリファレンス実装とこのツールボックスの他のコンポーネントには、次の依存関係が必要です。 Ubuntu 14.04でテストしました。

CUDA 7.5 および cuDNN 5.1。 NVIDIA への登録が必要な場合があります。以下は、cuDNN 5.1 をセットアップするための追加の手順です。注意ソフトウェアパッケージごとに必要なバージョンが異なる場合があるため、異なるバージョンの cuDNN を異なるディレクトリ ( /usr/local/cudnn/vXXなど) にインストールすることを強くお勧めします。
```
LIB_DIR=lib $( [[ $( uname ) == " Linux " ]] && echo 64 )
CUDNN_LIB_DIR=/usr/local/cudnn/v5.1/ $LIB_DIR
echo LD_LIBRARY_PATH= $LD_LIBRARY_PATH : $CUDNN_LIB_DIR >> ~ /.profile && ~ /.profile

tar zxvf cudnn * .tgz
sudo cp cuda/ $LIB_DIR / * $CUDNN_LIB_DIR /
sudo cp cuda/include/ * /usr/local/cudnn/v5.1/include/
```
OpenCV (OpenCV 2.4.11 でテスト済み)

画像ファイルの読み込みに使用します

Matlab 2015b 以降 (Matlab 2016a でテスト済み)

デモ: 3Dmatch を使用して 2 つの点群を位置合わせする

デモティーザー

このデモでは、事前にトレーニングされた 3DMatch 記述子 (Marvin を使用) と標準 RANSAC を使用して、2 つの 3D 点群 (単一ビューの深度マップから投影) を位置合わせします。

説明書

3DMatch ツールボックスをチェックアウトし、C++/CUDA デモコードと Marvin をコンパイルします。
```
git clone https://github.com/andyzeng/3dmatch-toolbox.git 3dmatch-toolbox
cd 3dmatch-toolbox/core
./compile.sh
```
3DMatch 事前トレーニング済みウェイトをダウンロード
```
./download-weights.sh # 3dmatch-weights-snapshot-137000.marvin
```
2 つのサンプル 3D 点群をロードし、それらの TDF ボクセルグリッドボリュームを計算し、ランダムなサーフェスキーポイントとその 3DMatch 記述子 (ディスク上のバイナリファイルに保存) を計算します。警告: このデモは、単純なバイナリ形式で保存された 3D 点群のみを読み取ります。独自の点群形式で 3DMatch デモコードを実行したい場合は、demo.cu をそれに応じて変更してください。
```
 # Generate fragment-1.desc.3dmatch.bin and fragment-1.keypts.bin
./demo ../data/sample/3dmatch-demo/single-depth-1.ply fragment-1

# Generate fragment-2.desc.3dmatch.bin and fragment-2.keypts.bin
./demo ../data/sample/3dmatch-demo/single-depth-2.ply fragment-2 
```

Matlab で次のスクリプトを実行します。

 % Load keypoints and 3DMatch descriptors and use RANSAC to register the two
% point clouds. A visualization of the aligned point clouds is saved into
% the file `result.ply` which can be viewed with Meshlab or any other 3D
% viewer. Note: there is a chance that alignment may fail on the first try
% of this demo due to bad keypoints, which are selected randomly by default.
demo ;

3D データを TDF ボクセルグリッドに変換する

さまざまな 3D データ表現を TDF (Truncated Distance Function) 値のボクセルグリッドに変換する方法についての説明。

点群から TDF ボクセルグリッドへ (最近傍点距離を使用)

占有ボクセルグリッドを使用して TDF 値を (高速に) 近似する C++/CUDA デモコード (ComputeTDF) を参照してください。
代替案: 正確な TDF 値を計算しますが、非常に遅い Matlab/CUDA コードを参照してください。
代替案: 正確な TDF 値も計算しますが、Matlab 上でスタンドアロンで動作する Matlab コードを参照してください。点群が小さい場合は、通常、メモリの問題なく実行されます。

TDF ボクセルグリッドへのメッシュ (GAPS によるメッシュサーフェスの距離変換を使用)。 GAPS のバージョンがすでにこのリポジトリに含まれていることに注意してください。

GAPS をインストールし、サンプルメッシュ (.off ファイル) をボクセルグリッド (フロートのバイナリ .raw ファイル) に変換する手順:

 cd 3dmatch-toolbox/gaps

# Install GAPS
make

# Run msh2df on example mesh file (see comments in msh2df.cpp for more instructions)
cd bin/x86_64
wget http://vision.princeton.edu/projects/2016/3DMatch/downloads/gaps/bicycle000002.off
./msh2df bicycle000002.off bicycle000002.raw -v # see comments in msh2df.cpp for more arguments

# Download visualization script
wget http://vision.princeton.edu/projects/2016/3DMatch/downloads/gaps/showTDF.m

Matlab で視覚化スクリプトを実行する

 % Visualize TDF voxel grid of mesh
showTDF ;

TDF ボクセルグリッドへの深度マップ

深度マップを 3D カメラ空間の点群に投影し、点群から TDF ボクセルグリッドに変換します (上記を参照)
代替案: 深度マップから TSDF ボリュームに変換し (手順はこちらを参照)、各ボクセルの絶対値 (別名、射影 TDF 値。ビューの境界や深度が欠落している領域の近くでは動作が異なります) を計算します。

RGB-D 再構成からの 3DMatch のトレーニング

フォルダー3dmatch-toolbox/training参照してください。

軽量の GPU 専用ニューラルネットワークフレームワークである Marvin を使用して 3DMatch をトレーニングするためのコード。シャムネットワークアーキテクチャの .json ファイルtraining/net.jsonと、RGB-D 再構成データセット (プロジェクト Web ページからダウンロード可能) からの対応をランダムにサンプリングするtraining/match.hppの CUDA/C++ Marvin データレイヤーが含まれています。

クイックスタート

マービンをコンパイルする

 cd 3dmatch-toolbox/training
./compile.sh

RGB-D 再構成データセットからいくつかのトレーニングシーンとテストシーンをダウンロードします (ここからさらにシーンをダウンロードします)

 cd ../data
mkdir train && mkdir test && mkdir backup
cd train
wget http://vision.princeton.edu/projects/2016/3DMatch/downloads/rgbd-datasets/sun3d-brown_cogsci_1-brown_cogsci_1.zip
wget http://vision.princeton.edu/projects/2016/3DMatch/downloads/rgbd-datasets/7-scenes-heads.zip
wget http://vision.princeton.edu/projects/2016/3DMatch/downloads/rgbd-datasets/sun3d-harvard_c11-hv_c11_2.zip
unzip sun3d-brown_cogsci_1-brown_cogsci_1.zip
unzip 7-scenes-heads.zip
unzip sun3d-harvard_c11-hv_c11_2.zip
mv * .zip ../backup
cd ../test
wget http://vision.princeton.edu/projects/2016/3DMatch/downloads/rgbd-datasets/sun3d-hotel_umd-maryland_hotel3.zip
unzip sun3d-hotel_umd-maryland_hotel3.zip
mv * .zip ../backup
cd ../../training

data/trainに保存された RGB-D シーンからの対応に基づいて 3Dmatch モデルを最初からトレーニングします。
```
./marvin train net.json
```
(オプション) Marvin テンソルファイルからの事前トレーニング済みの重みを使用して 3Dmatch をトレーニングする
```
./marvin train net.json your-pre-trained-weights.marvin
```

追加のセットアップ手順

プロジェクトの Web ページで、RGB-D 再構築データセットからさらに多くのシーンをダウンロードできます。これらのデータセットは、3DMatch のトレーニングに使用される Marvin データレイヤーと互換性のある統一形式に変換されています。フォルダー階層が次のようになるように、少なくとも 1 つのシーンをdata/trainに保存し、別のシーンをdata/testに保存します。

 | ——— training
     | ——— core
          | ——— marvin.hpp
          | ——— ...
| ——— data
     | ——— train
          | ——— rgbd-dataset-scene-1
               | ——— seq-01
               | ——— seq-02
               | ——— camera-intrinsics.txt
               | ——— ...
          | ——— ...
     | ——— test
          | ——— rgbd-dataset-scene-2
               | ——— seq-01
               | ——— camera-intrinsics.txt
               | ——— ...

マルチフレーム深度の TSDF フュージョン

フォルダー3dmatch-toolbox/depth-fusion参照してください。

複数の登録された深度マップを TSDF ボクセルボリュームに融合する CUDA/C++ コード (Curless および Levoy 1996)。これを使用してサーフェスメッシュと点群を作成できます。

デモ

このデモでは、ディレクトリdata/sample/depth-fusion-demo/rgbd-framesにある 50 の登録済み深度マップを TSDF ボクセルボリュームに融合し、表面点群tsdf.plyを作成します。

 cd 3dmatch-toolbox/depth-fusion
./compile.sh
./demo # output saved to tsdf.ply

評価コード

フォルダー3dmatch-toolbox/evaluation参照してください。

Keypoint Matching Benchmark と Geometric Registration Benchmark の評価コード、および論文の実験のリファレンス実装。

キーポイントマッチングベンチマーク

フォルダー3dmatch-toolbox/evaluation/keypoint-matching参照してください。

ベンチマークの説明とリーダーボードはここでご覧いただけます。

評価例

3dmatch-toolbox/evaluation/keypoint-matchingに移動し、Matlab で次のコマンドを実行します。
```
 % Evaluate 3DMatch (3dmatch.log) on the validation set (validation-set-gt.log)
getError ;
```

検証セットに対して 3DMatch を実行して、.log ファイル (3dmatch.log) を生成します。

Marvin を使用して C++/CUDA コードをコンパイルして 3DMatch 記述子を計算する
```
 cd 3dmatch-toolbox/evaluation/keypoint-matching
./compile.sh
```
3DMatch 事前トレーニング済みウェイトをダウンロード
```
./download-weights.sh # 3dmatch-weights-snapshot-137000.marvin
```

検証セットとテストセットをダウンロードする

./download-validation.sh # validation-set.mat
./download-test.sh # test-set.mat

Matlab で次のスクリプトを変更して実行します。

 % Runs 3DMatch on the validation set and generates 3dmatch.log
test3DMatch ;

RGB-D 再構築から独自の対応データセットを生成

プロジェクト Web ページで RGB-D 再構築データセットから 1 つ以上のシーンをダウンロードします。上記のようにフォルダー階層を整理します。
Matlab で次のスクリプトを変更して実行します。
```
 makeCorresDataset ;
```

幾何学的登録ベンチマーク

フォルダー3dmatch-toolbox/evaluation/geometric-registration参照してください。

ここで説明する幾何学的登録ベンチマークで評価を実行する Matlab コードが含まれています。概要：

getKeyptsAndDesc.m - シーンフラグメントの中間データ (TDF ボクセルボリューム、キーポイント、および 3DMatch 記述子) を生成します。ここから事前に計算されたデータをダウンロードすることもできます。
runFragmentRegistration.m - 中間データを読み取り、フラグメントのすべてのペアに対して RANSAC ベースの登録を実行します。
writeLog - フラグメントのすべてのペアから登録結果を読み取り、.log ファイルを作成します。
evaluate.m - 評価のために .log ファイルから精度と再現率を計算します。

評価例

Matlab で次を実行します。

 % Evaluate 3DMatch on the geometric registration benchmark
evaluate ;

注: 合成ベンチマークからのシーンフラグメントの TDF ボクセルグリッドは、正確な TDF を得るために非推奨のコードを使用して計算されました ( deprecated/pointCloud2AccTDF.mを参照)。トレーニングフラグメントに基づいて微調整された 3DMatch 事前トレーニング済みの重みは、ここからダウンロードできます。

Amazon ピッキングチャレンジにおける 6D オブジェクトの姿勢推定のモデルフィッティング

フォルダー3dmatch-toolbox/evaluation/model-fitting-apc参照してください。

シェルフ & トートデータセットに適合するモデルについて 3Dmatch を評価するためのコードと事前トレーニングされたモデルが含まれています。事前に計算されたデータ (オブジェクトとスキャンの TDF ボクセルグリッドボリューム、サーフェスキーポイント、記述子、ポーズ予測) をここからダウンロードできます。評価例として、Matlab スクリプトgetError.mを実行します。

Shape2Poseでのメッシュ対応

フォルダー3dmatch-toolbox/evaluation/mesh-correspondence-shape2poseを参照してください。

3DMatch を使用して Shape2Pose データセットからメッシュ上にメッシュ対応視覚化を生成するコードが含まれています。事前に計算されたデータ (メッシュの TDF ボクセルグリッドボリューム、サーフェスキーポイント、3DMatch 記述子) をここからダウンロードすることもできます。簡単に視覚化するには、Matlab スクリプトkeypointRetrieval.mを実行します。

拡大する

追加情報