Varusはもともと、Mario Stankeが監督した学士号としてWilly Bruhnによって書かれていました。このリポジトリは、2018年11月に作成されたhttps://github.com/willybruhn/varusのコピーであり、多くのバグフィックス、インクリメンタルなイントロンデータベース機能、およびHisat al Alternativeアライメントプログラムを使用するための拡張機能を含んでいます。
Varusは、遺伝子フィンダートレーニングとゲノム注釈を目的として、多くの遺伝子の十分に高いカバーをターゲットにする、NCBIのシーケンス読み取りアーカイブ(SRA)から限られた数のRNA-SEQ読み取りの選択とダウンロードを自動化します。オンラインアルゴリズムの各反復
リポジトリをクローンするために、コマンドラインから次のコマンドを呼び出します。
git clone https://github.com/MarioStanke/VARUS.git
varusは依存します
sudo apt-get install bamtools libbamtools-dev
でインストールVarusを手動でコンパイルします
cd Implementation
make
デフォルトでは、NCBIツールfastq-dump
データがダウンロードされている実行ファイルと同じサイズの~/ncbi
の下に一時ファイルを作成します。おそらくほとんどのユーザーにとってハードドライブスペースが多すぎるこのキャッシュ動作を無効にします
mkdir -p ~/.ncbi
echo '/repository/user/cache-disabled = "true"' >> ~/.ncbi/user-settings.mkfg
ディレクトリのexample
に変更し、例/readmeの指示に従ってください。
ファイルVARUSparameters.txt
サンプルフォルダーからワーキングディレクトリにコピーし、必要に応じて調整します。
最も重要なパラメーター:
- バッチサイズ各反復でダウンロードする読み取りの数を指定します(例:50000または200000)
-MaxBatchesはせいぜい数のバッチをダウンロードする必要があるかを指定します
最終出力は、 varus.bamと呼ばれるソートされたスプライスされたアライメントファイル(すべてバッチを一緒にバッチ)です。
引用してください:varus:サンプリング補完的なRNA読み取りは、シーケンス読み取りアーカイブから読み取ります。 2019; BMC Bioinformatics 、20:558
/docs /論文のvarusに対応するウィリーブルーンの学士論文を見つけます。