talk2bevダウンロードtalk2bevソースコードのダウンロード

talk2bev

その他のソースコード

1.0.0

ダウンロード

Talk2Bev：言語強化された鳥瞰図マップ

プロジェクトページ| arxiv |ビデオ

Vikrant Dewangan* ¹ 、Tushar Choudhary* ¹ 、Shivam Chandhok* ² 、Shubham Priyadarshan ¹ 、Anushka Jain ¹ 、Arun K. Singh ³ 、Siddharth Srivastava ⁴ 、Krishna Murthy Jatavallabhula $^ Dagger $ ⁵ 、K。マダバクリシュナ $^ Dagger $ ¹

¹国際情報技術研究所ハイデラバード、 ²ブリティッシュコロンビア大学、 ³ Tartu University ⁴ Tensortour Inc ⁵ MIT-CSAIL

*等しい貢献を示します、 $^ Dagger $等しいアドバイスを示します

ICRA 2024

Methodology.mp4

抽象的な

自律運転で一般的に使用される鳥瞰図（BEV）マップのための大きなビジョン言語モデル（LVLM）インターフェイスであるTalk2Bevを紹介します。

自律運転シナリオの既存の認識システムは、オブジェクトカテゴリの事前に定義された（クローズド）セットと運転シナリオに主に焦点を当てていますが、Talk2Bevは、代わりにパフォーマンスのある事前訓練を受けたLVLMSに依存する可能性を排除します。これにより、単一のシステムは、視覚的および空間的推論を含むさまざまな自律運転タスクに対応し、トラフィックアクターの意図を予測し、視覚的な手がかりに基づいた意思決定に対応できます。

フリーフロムの自然言語クエリを解釈する能力の両方に依存しているタスクを理解し、言語で強化されたBEVマップに組み込まれた視覚的コンテキストにこれらのクエリを接地する際に、Talk2Bevを多数のシーンを理解しています。自律運転シナリオのLVLMSでのさらなる研究を可能にするために、nuscenesデータセットから20,000を超える質問と地上反応を伴う、1000以上のヒトが解決したBEVシナリオを通過するベンチマークを吸収するTalk2bev-benchを開発およびリリースします。

データの準備

Nuscenes V1.0-Trainvalデータセットをダウンロードしてください。私たちのデータセットは、ベース（作物、視点画像、BEVエリア重心）と作物のキャプションで構成される2つの部品とtalk2bev-captionsで構成されています。

リンクをダウンロードします

Talk2Bevデータセット（ Talk2bev-mini （キャプションのみ）とtalk2bev-full ）への2つのリンクを以下に提供します。データセットはGoogleドライブでホストされています。データセットをダウンロードして、ファイルをdataフォルダーに抽出してください。

名前	ベース	キャプション	ベンチ	リンク
talk2bev- mini	✓✓	✗	✗	リンク
talk2bev- full	✗	✗	✗	トト

データセットをゼロから生成したい場合は、こちらのプロセスに従ってください。各データパーツの形式は、形式で説明されています。

評価

Talk2Bevの評価は、MCQ（Talk2Bev -Benchから）および空間演算子の2つの方法で発生します。評価にはGPT-4を使用します。 GPT-4の指示に従って、OS envのAPIキーと組織を初期化してください。

ORGANIZATION= < your-organization >
API_KEY= < your-api-key >

評価-MCQ

MCQの精度を取得するには、次のコマンドを実行してください。

 cd evaluation
python eval_mcq.py

これにより、MCQの精度が得られます。

空間演算子の評価

距離エラーを取得するには、MCQのIOUを取得するには、次のコマンドを実行してください。

 cd evaluation
python eval_spops.py

click2chat

また、BEVとの自由形式の会話も許可しています。 click2chatの指示に従って、BEVとチャットしてください。

talk2bev-bench

リリースされる

トト

空間演算子評価パイプライン
Bev作物へのリンクを追加 - Talk2bev-fullをリリースします
talk2bev-benchをリリースします

拡大する

追加情報

バージョン 1.0.0
タイプその他のソースコード
更新時間 2025-02-26
サイズ 77.03MB
から Github

talk2bev

Talk2Bev：言語強化された鳥瞰図マップ

抽象的な

データの準備

リンクをダウンロードします

評価

評価-MCQ

空間演算子の評価

click2chat

talk2bev-bench

トト

waymo open dataset

Sunamu

MySchedule.py

SmartTube

chat.petals.dev

viptools for eslam

chat.petals.dev

GPT Prompt Templates

GPTyped

waymo open dataset

Sunamu

MySchedule.py

waymo open dataset

termwind

wp functions