电子邮件:[email protected]
请访问我们的下载页面以获取预构建的二进制文件。
请检查 CHANGES.md 文件以获取更改历史记录。
NCBI 的 SRA 工具包和 SDK 是用于使用 INSDC 序列读取档案中的数据的工具和库的集合。
2024 年 5 月 21 日: SRA 工具包版本 3.1.1
改进了用户的预取错误和信息消息。
修复了在 Windows 上构建时的错误和警告。
2024 年 3 月 5 日: SRA 工具包版本 3.1.0
使用 prefetch --eliminate-quals 现在将下载 SRA Lite 数据或报告 Lite 版本不可用。
减少云用户全局超时的频率。
如果数据(blob)校验和丢失,vdb-validate 将报告错误。
添加了对 AlmaLinux 的支持。
修复了 macOS 和 BSD 上的挂起问题。
2023 年 12 月 19 日: SRA 工具包版本 3.0.10
修复了将 JWT 与某些云存储结合使用时的错误。
添加了对 arm64 处理器的构建支持。
2023 年 8 月 29 日: SRA 工具包 3.0.7
更新了 vdb-config 以改进 AWS 凭证接口和 SRA Toolkit 的使用。
修复了带有预取功能的 AWS 凭证中的错误。
修复了导致运行中存储的参考序列出现“未找到参考”消息的错误。
2023 年 7 月 10 日: SRA 工具包 3.0.6
预取现在支持最新的 GCP 访问令牌。
修复了 Windows 用户的 vdb-config 中的错误。
为了确保技术读取的输出,如果使用 --include-technical 选项,fasterq-dump 现在将自动切换到 --split-files 模式。
2023 年 5 月 9 日: SRA 工具包 3.0.5
为 Fasterq-dump 添加了对 PacBio 的支持。
添加了将参考序列输出到 fastq-dump 的功能。
修复了使用 ngc 文件时 dbGaP 数据访问的错误。
2023 年 1 月 3 日: SRA 工具包 3.0.3
修复了 sra-stat 中的回归。
2022 年 12 月 12 日: SRA 工具包 3.0.2
修复了“在文本模块内转换字符串时缓冲区不足”在 Mac 上预取失败的问题。
2022 年 11 月 15 日: SRA 工具包 3.0.1
删除了配置 SRA 工具包的交互要求。
存储库结构的更改:
为了更好地服务不同的用户组,sra-tools存储库的tools/目录分为几个子目录:
external/ - 构成面向最终用户的 sra 工具包的工具。这些是安装在工具包用户计算机上的工具。这是默认的 make 目标
内部/ - 面向工具包开发人员和 NCBI 内部用户的工具
loaders/ - 存档加载管道中使用的工具,例如 NCBI SRA
test-tools/ - 工具包的 NCBI 内部测试中使用的工具。
默认的“make”命令现在将仅构建外部工具。要构建其他类别的工具,请使用这些目标/标志:
'make all' - 构建所有内容,包括测试项目(位于 sra-tools/test/ 中)
'make BUILD_TOOLS_INTERNAL=ON' - 构建外部和内部工具
'make BUILD_TOOLS_LOADERS=ON' - 构建外部工具和加载程序
'make BUILD_TOOLS_TEST_TOOLS=ON' - 构建外部工具和测试工具
'make TOOLS_ONLY=ON' - 跳过构建测试项目
上面显示的构建标志可以组合在同一命令行上,例如“make BUILD_TOOLS_LOADERS=ON BUILD_TOOLS_INTERNAL=ON TOOLS_ONLY=ON”将构建除测试工具和测试项目之外的所有内容。
2022 年 8 月 4 日:安全更新
由于 NCBI 的安全性更新,SRA Toolkit 2.9.6 及更早版本将不再能够连接到 NCBI 数据位置服务。我们建议受影响的用户更新到 SRA 工具包的最新版本。
2022 年 2 月 10 日: SRA 工具包 3.0.0
NCBI 的 SRA 更改了源构建系统,以在工具包版本 3.0.0 中使用 CMake。这一变化是提高开发人员生产力的重要一步,因为它提供了统一的跨平台访问来支持多个构建系统。此更改会影响从源代码构建 NCBI SRA 工具的开发人员。不再支持旧的 makefile 和构建系统。
此更改还包括 GitHub 存储库的结构,该存储库经过整合,为构建工具和库提供更简单的环境(NGS 库和依赖项已整合)。 NGS 库和依赖项的整合提供了更好的使用范围隔离,并使构建更加简单。
NCBI/NGS
该存储库已冻结。所有未来的开发都将在 GitHub 存储库 ncbi/sra-tools (此存储库)中进行,位于子目录ngs/
下。
NCBI/NCBI-vdb
该项目的构建系统基于CMake。通过 NGS API 提供对 VDB 格式的 SRA 数据访问的库已移至 GitHub 存储库 ncbi/sra-tools。
旧(基本 URL:https://github.com/ncbi/ncbi-vdb) | 新(基本 URL:https://github.com/ncbi/sra-tools) |
---|---|
libs/ngs | ngs/ncbi/ngs |
libs/ngs-c++ | ngs/ncbi/ngs-c++ |
libs/ngs-jni | ngs/ncbi/ngs-jni |
libs/ngs-py | ngs/ncbi/ngs-py |
libs/vdb-sqlite | libs/vdb-sqlite |
test/ngs-java | test/ngs-java |
test/ngs-python | test/ngs-python |
ncbi/sra-tools(此存储库)
该项目的构建系统基于CMake。该项目获得了一些新组件,如上表所列。
2021 年 10 月 25 日。SRA 工具包 2.11.3:
修复了 fasta 和 fasta 未排序参数正常工作的错误。
2021 年 10 月 7 日。SRA 工具包 2.11.2:
SRA 数据现在可以提供完整的碱基质量分数(SRA 标准化格式)或简化的质量分数(SRA Lite),具体取决于用户偏好。这两种格式都可以按需流式传输到相同的文件类型(fastq、sam 等),因此它们都与期望质量分数的现有工作流程和应用程序兼容。然而,SRA Lite 格式要小得多,可以减少存储占用空间和数据传输时间,从而可以更快地完成转储。 SRA 工具包默认使用 SRA 标准化格式,其中包括完整的、每个碱基的质量分数,但不需要完整的碱基质量分数进行分析的用户可以请求 SRA Lite 版本,以节省数据传输时间。要在使用 SRA 工具包时请求 SRA Lite 数据,请在工具包配置的主页上设置“首选具有简化基本质量分数的 SRA Lite 文件”选项 - 这将指示工具在可用时优先使用 SRA Lite 格式(请务必使用工具包版本2.11.2或更高版本来访问此功能)。对于给定读取中的每个碱基,从 SRA Lite 文件生成的质量分数将相同(质量 = 30 或 3,具体取决于读取过滤器标志设置为“通过”还是“拒绝”)。具有完整碱基质量分数的 SRA 标准化格式的数据将继续具有 .sra 文件扩展名,而 SRA Lite 文件具有 .sralite 文件扩展名。欲了解更多信息,请参阅我们的数据格式页面。
2021 年 8 月 17 日:SRA 工具包 2.11.1。
2021 年 3 月 15 日:SRA 工具包 2.11.0。
2020 年 12 月 16 日:SRA 工具包 2.10.9。
2020 年 6 月 29 日:SRA 工具包 2.10.8。
2020 年 5 月 20 日:SRA 工具包 2.10.7。
2020 年 5 月 18 日:SRA 工具包 2.10.6。
2020 年 4 月 1 日:SRA 工具包 2.10.5。
2020 年 2 月 26 日:SRA 工具包 2.10.4。
2020 年 2 月 18 日:SRA 工具包 2.10.3。
sra-tools
版本 2.10.2 提供对 AWS 和 GCP 环境中 SRA 的所有公共和受控访问 dbGaP的访问(此版本仅适用于 Linux) 。这个庞大档案的原始提交格式和 SRA 格式的数据都可以在这些云上访问和计算,从而无需从 NCBI FTP 下载并提高性能。
除了公共和受控访问 dbGaP 数据的 ETL 数据之外, prefetch
工具还检索原始提交文件。
在sra-tools
2.10.0 版本中,我们添加了适用于 AWS 和 GCP 环境的云原生操作(此版本仅适用于 Linux) ,以便与公共 SRA 一起使用。 prefetch
除了 ETL 数据之外,还能够检索原始提交文件。
在sra-tools
2.9.1 版本中,我们终于推出了fasterq-dump
工具,它是更旧的fastq-dump
工具的替代品。顾名思义,它运行速度更快,更适合将 SRA 对象大规模转换为 FASTQ 文件,这些文件在具有足够磁盘空间用于临时文件的站点上很常见。 fasterq-dump
是多线程的,与fastq-dump
相比,它以提高性能的方式执行批量联接,fastq-dump 在每条记录的基础上执行联接(并且是单线程的) 。
fastq-dump
仍然受支持,因为它比fasterq-dump
处理更多的极端情况,但将来可能会被弃用。
您可以在我们的 Wiki 中获取有关fasterq-dump
的更多信息:https://github.com/ncbi/sra-tools/wiki/HowTo:-fasterq-dump。
有关使用、配置和构建工具包的更多信息,请访问我们的 wiki 或 NCBI 网站
SRA 工具包开发团队