電子メール: [email protected]
事前に構築されたバイナリについては、ダウンロード ページにアクセスしてください。
変更履歴については、CHANGES.md ファイルを確認してください。
NCBI の SRA ツールキットと SDK は、INSDC シーケンス リード アーカイブ内のデータを使用するためのツールとライブラリのコレクションです。
2024 年 5 月 21 日: SRA ツールキット リリース 3.1.1
ユーザー向けのプリフェッチ エラーと情報メッセージが改善されました。
Windows 上でビルドする際のエラーと警告を修正しました。
2024 年 3 月 5 日: SRA ツールキット リリース 3.1.0
prefetch --eliminate-quals を使用すると、SRA Lite データがダウンロードされるか、Lite バージョンが利用できないことが報告されます。
クラウド ユーザーのグローバル タイムアウトの頻度が減少しました。
データ (BLOB) チェックサムが欠落している場合、vdb-validate はエラーを報告します。
AlmaLinux のサポートが追加されました。
macOS および BSD でのハングを修正しました。
2023 年 12 月 19 日: SRA ツールキット リリース 3.0.10
一部のクラウド ストレージで JWT を使用する際のバグを修正しました。
arm64 プロセッサのビルド サポートを追加しました。
2023 年 8 月 29 日: SRA ツールキット 3.0.7
AWS 認証情報インターフェイスと SRA Toolkit による使用法を改善するために vdb-config を更新しました。
プリフェッチによる AWS 認証情報のバグを修正しました。
実行内に保存された参照シーケンスに対して「参照が見つかりません」というメッセージが表示されるバグを修正しました。
2023 年 7 月 10 日: SRA ツールキット 3.0.6
プリフェッチが最新の GCP アクセス トークンをサポートするようになりました。
Windows ユーザー向けの vdb-config のバグを修正しました。
技術的な読み取りの出力を確実にするために、--include-technical オプションが使用されている場合、fasterq-dump は自動的に --split-files モードに切り替わるようになりました。
2023 年 5 月 9 日: SRA ツールキット 3.0.5
PacBio のサポートが fastq-dump に追加されました。
リファレンスシーケンスをfasterq-dumpに出力する機能を追加しました。
ngc ファイルを使用する場合の dbGaP データ アクセスのバグを修正しました。
2023 年 1 月 3 日: SRA ツールキット 3.0.3
sra-stat の回帰を修正しました。
2022 年 12 月 12 日: SRA ツールキット 3.0.2
Mac でのプリフェッチの「テキスト モジュール内の文字列の変換中にバッファが不足しています」というエラーが修正されました。
2022 年 11 月 15 日: SRA ツールキット 3.0.1
SRA Toolkit を設定するための対話型要件が削除されました。
リポジトリ構造への変更:
さまざまなユーザー グループに適切にサービスを提供するために、sra-tools リポジトリの tools/ ディレクトリはいくつかのサブディレクトリに分割されています。
external/ - エンドユーザー向けの sra-toolkit を構成するツール。これらは、ツールキット ユーザーのマシンにインストールされるツールです。これはデフォルトのメイクターゲットです
Internal/ - ツールキットの開発者および NCBI 内部ユーザー向けのツール
loaders/ - NCBI SRA などのアーカイブ読み込みパイプラインで使用されるツール
test-tools/ - ツールキットの NCBI 内部テストで使用されるツール。
デフォルトの「make」コマンドは外部ツールのみをビルドするようになりました。他のカテゴリのツールを構築するには、次のターゲット/フラグを使用します。
「make all」 - テスト プロジェクト (sra-tools/test/ にあります) を含むすべてをビルドします。
'make BUILD_TOOLS_INTERNAL=ON' - 外部ツールと内部ツールをビルドします
'make BUILD_TOOLS_LOADERS=ON' - 外部ツールとローダーをビルドします。
'make BUILD_TOOLS_TEST_TOOLS=ON' - 外部ツールとテスト ツールをビルドします。
'make TOOLS_ONLY=ON' - テスト プロジェクトのビルドをスキップします。
上記のビルド フラグは同じコマンド ラインで組み合わせることができます。たとえば、「make BUILD_TOOLS_LOADERS=ON BUILD_TOOLS_INTERNAL=ON TOOLS_ONLY=ON」と指定すると、テスト ツールとテスト プロジェクトを除くすべてがビルドされます。
2022 年 8 月 4 日: セキュリティ更新プログラム
NCBI のセキュリティが更新されたため、SRA Toolkit 2.9.6 以前のバージョンは NCBI データ ロケーション サービスに接続できなくなります。影響を受けるユーザーには、SRA ツールキットの最新バージョンに更新することをお勧めします。
2022 年 2 月 10 日: SRA ツールキット 3.0.0
NCBI の SRA は、ツールキット リリース 3.0.0 で CMake を使用するようにソース ビルド システムを変更しました。この変更は、複数のビルド システムをサポートするための統合されたクロスプラットフォーム アクセスを提供するため、開発者の生産性を向上させるための重要なステップです。この変更は、NCBI SRA ツールをソースから構築する開発者に影響します。古いメイクファイルとビルド システムはサポートされなくなりました。
この変更には、ツールやライブラリを構築するためのより簡単な環境を提供するために統合された GitHub リポジトリの構造も含まれています (NGS ライブラリと依存関係が統合されています)。 NGS ライブラリと依存関係を統合すると、使用範囲の分離が向上し、構築がより簡単になります。
NCBI/NGS
このリポジトリは凍結されています。今後の開発はすべて、サブディレクトリngs/
の下の GitHub リポジトリ ncbi/sra-tools (このリポジトリ) で行われます。
ncbi/ncbi-vdb
このプロジェクトのビルド システムは CMake に基づいています。 NGS API 経由で VDB 形式の SRA データへのアクセスを提供するライブラリは、GitHub リポジトリ ncbi/sra-tools に移動されました。
旧(ベースURL:https://github.com/ncbi/ncbi-vdb) | 新規 (ベース URL: https://github.com/ncbi/sra-tools) |
---|---|
libs/ngs | ngs/ncbi/ngs |
libs/ngs-c++ | ngs/ncbi/ngs-c++ |
libs/ngs-jni | ngs/ncbi/ngs-jni |
libs/ngs-py | ngs/ncbi/ngs-py |
libs/vdb-sqlite | libs/vdb-sqlite |
test/ngs-java | test/ngs-java |
test/ngs-python | test/ngs-python |
ncbi/sra-tools (このリポジトリ)
このプロジェクトのビルド システムは CMake に基づいています。上の表にリストされているように、プロジェクトはいくつかの新しいコンポーネントを取得しました。
2021 年 10 月 25 日。SRA ツールキット 2.11.3:
fastq-dump のバグを修正しました。fasta および fasta-unsorted パラメータが正しく動作します。
2021 年 10 月 7 日。SRA ツールキット 2.11.2:
SRA データは、ユーザーの好みに応じて、完全な基本品質スコア (SRA Normalized Format) または簡略化された品質スコア (SRA Lite) のいずれかで利用できるようになりました。どちらの形式も同じファイルタイプ (fastq、sam など) にオンデマンドでストリーミングできるため、品質スコアを期待する既存のワークフローやアプリケーションと互換性があります。ただし、SRA Lite 形式ははるかに小さいため、ストレージの設置面積とデータ転送時間を削減でき、ダンプをより迅速に完了できます。 SRA ツールキットはデフォルトで、塩基ごとの完全な品質スコアを含む SRA 正規化フォーマットを使用しますが、分析に完全な塩基品質スコアを必要としないユーザーは、データ転送時間を節約するために SRA Lite バージョンをリクエストできます。 SRA ツールキットの使用時に SRA Lite データをリクエストするには、ツールキット設定のメイン ページで [簡略化された基本品質スコアを持つ SRA Lite ファイルを優先する] オプションを設定します。これにより、利用可能な場合は SRA Lite 形式を優先的に使用するようにツールに指示されます (この機能にアクセスするには、必ずツールキット バージョン 2.11.2 以降を使用してください)。 SRA Lite ファイルから生成された品質スコアは、特定のリード内の各塩基で同じになります (リード フィルター フラグが「合格」または「拒否」に設定されているかどうかに応じて、品質 = 30 または 3)。完全な基本品質スコアを持つ SRA 正規化フォーマットのデータには引き続き .sra ファイル拡張子が付きますが、SRA Lite ファイルには .sralite ファイル拡張子が付きます。詳細については、データ形式のページをご覧ください。
2021 年 8 月 17 日: SRA ツールキット 2.11.1。
2021 年 3 月 15 日: SRA ツールキット 2.11.0。
2020 年 12 月 16 日: SRA ツールキット 2.10.9。
2020 年 6 月 29 日: SRA ツールキット 2.10.8。
2020 年 5 月 20 日: SRA ツールキット 2.10.7。
2020 年 5 月 18 日: SRA ツールキット 2.10.6。
2020 年 4 月 1 日: SRA ツールキット 2.10.5。
2020 年 2 月 26 日: SRA ツールキット 2.10.4。
2020 年 2 月 18 日: SRA ツールキット 2.10.3。
sra-tools
のリリース 2.10.2 では、AWS および GCP 環境(このリリースでは Linux のみ)内の SRA のすべてのパブリックおよびアクセス制御された dbGaPへのアクセスが提供されます。この膨大なアーカイブのオリジナルの提出形式と SRA 形式のデータは両方ともこれらのクラウド上でアクセスおよび計算できるため、NCBI FTP からダウンロードする必要がなくなり、パフォーマンスも向上します。
prefetch
ツールは、パブリックおよびアクセス制御された dbGaP データの ETL データに加えて、元の送信ファイルも取得します。
sra-tools
のリリース 2.10.0 では、パブリック SRA で使用するために、AWS および GCP 環境(このリリースでは Linux のみ)のクラウドネイティブ操作が追加されました。 prefetch
、ETL データに加えて、元の送信ファイルを取得できます。
sra-tools
のリリース 2.9.1 では、はるかに古いfastq-dump
ツールの代替となるツールfasterq-dump
ついに利用可能になりました。名前が示すとおり、実行速度が速く、一時ファイル用に十分なディスク容量があるサイトで一般的な、SRA オブジェクトから FASTQ ファイルへの大規模な変換に適しています。 fasterq-dump
マルチスレッドであり、レコードごとに結合を実行する(シングルスレッドである) fastq-dump
と比較して、パフォーマンスを向上させる方法で一括結合を実行します。
fastq-dump
fasterq-dump
よりも多くの特殊なケースを処理するため、引き続きサポートされていますが、将来的には非推奨になる可能性があります。
fasterq-dump
詳細については、Wiki (https://github.com/ncbi/sra-tools/wiki/HowTo:-fasterq-dump) で入手できます。
ツールキットの使用、構成、構築に関する詳細については、Wiki または NCBI の Web サイトを参照してください。
SRA ツールキット開発チーム