correo electrónico: [email protected]
Visite nuestra página de descarga para archivos binarios prediseñados.
Consulte el archivo CHANGES.md para ver el historial de cambios.
El SRA Toolkit y el SDK de NCBI son una colección de herramientas y bibliotecas para utilizar datos en los archivos de lectura de secuencias del INSDC.
21 de mayo de 2024 : Versión 3.1.1 del kit de herramientas SRA
Mensajes de información y errores de captación previa mejorados para los usuarios.
Se corrigieron errores y advertencias al compilar en Windows.
5 de marzo de 2024 : Versión 3.1.0 del kit de herramientas SRA
El uso de prefetch --eliminate-quals ahora descargará datos de SRA Lite o informará que una versión Lite no está disponible.
Frecuencia reducida de tiempos de espera globales para los usuarios de la nube.
vdb-validate informará un error si faltan sumas de verificación de datos (blob).
Se agregó soporte para AlmaLinux.
Se corrigió el bloqueo en macOS y BSD.
19 de diciembre de 2023 : Versión 3.0.10 del kit de herramientas SRA
Se corrigió un error al usar JWT con algo de almacenamiento en la nube.
Se agregó soporte de compilación para procesadores arm64.
29 de agosto de 2023 : Kit de herramientas SRA 3.0.7
Vdb-config actualizado para mejorar la interfaz de credenciales de AWS y el uso por parte de SRA Toolkit.
Se corrigió un error en las credenciales de AWS con captación previa.
Se corrigió un error que provocaba mensajes de "referencia no encontrada" para secuencias de referencia almacenadas dentro de una ejecución.
10 de julio de 2023 : Kit de herramientas SRA 3.0.6
Prefetch ahora admite los últimos tokens de acceso de GCP.
Se corrigió un error en vdb-config para usuarios de Windows.
Para garantizar la salida de lecturas técnicas, fastq-dump ahora cambiará automáticamente al modo --split-files si se usa la opción --include-technical.
9 de mayo de 2023 : Kit de herramientas SRA 3.0.5
Se agregó soporte para PacBio para acelerar el volcado de archivos.
Se agregaron funciones para generar secuencias de referencia en un volcado q más rápido.
Se corrigió un error en el acceso a datos dbGaP cuando se usaban archivos ngc.
3 de enero de 2023 : Kit de herramientas SRA 3.0.3
Se corrigió una regresión en sra-stat.
12 de diciembre de 2022 : Kit de herramientas SRA 3.0.2
Se corrigió el error de "búfer insuficiente al convertir una cadena dentro del módulo de texto" para la captación previa en Mac.
15 de noviembre de 2022 : Kit de herramientas SRA 3.0.1
Se eliminó el requisito interactivo para configurar SRA Toolkit.
Cambios en la estructura del repositorio:
Para servir mejor a grupos dispares de usuarios, el directorio tools/ del repositorio sra-tools se divide en varios subdirectorios:
externo/ - las herramientas que componen el usuario final frente a sra-toolkit. Estas son las herramientas que se instalan en la máquina de un usuario del kit de herramientas. Este es el objetivo predeterminado
internal/ - las herramientas orientadas a los desarrolladores del kit de herramientas y a los usuarios internos de NCBI
loaders/ - las herramientas utilizadas en los canales de carga de archivos, como NCBI SRA
test-tools/: las herramientas utilizadas en las pruebas internas del NCBI del kit de herramientas.
El comando predeterminado 'make' ahora solo compilará las herramientas externas. Para crear otras categorías de herramientas, utilice estos objetivos/indicadores:
'make all' - para compilar todo, incluidos los proyectos de prueba (ubicados en sra-tools/test/)
'make BUILD_TOOLS_INTERNAL=ON' - para construir las herramientas externas e internas
'make BUILD_TOOLS_LOADERS=ON' - para construir las herramientas externas y los cargadores
'make BUILD_TOOLS_TEST_TOOLS=ON' - para construir las herramientas externas y las herramientas de prueba
'make TOOLS_ONLY=ON' - para omitir la creación de proyectos de prueba
Los indicadores de compilación que se muestran arriba se pueden combinar en la misma línea de comando, por ejemplo, 'make BUILD_TOOLS_LOADERS=ON BUILD_TOOLS_INTERNAL=ON TOOLS_ONLY=ON' compilará todo excepto las herramientas de prueba y los proyectos de prueba.
4 de agosto de 2022 : Actualización de seguridad
Debido a la seguridad actualizada en NCBI, las versiones de SRA Toolkit 2.9.6 y anteriores ya no podrán conectarse al servicio de ubicación de datos de NCBI. Recomendamos a los usuarios afectados que actualicen a la última versión del SRA Toolkit.
10 de febrero de 2022 : Kit de herramientas SRA 3.0.0
La SRA de NCBI cambió el sistema de compilación de origen para usar CMake en la versión 3.0.0 del kit de herramientas. Este cambio es un paso importante para mejorar la productividad de los desarrolladores, ya que proporciona acceso unificado multiplataforma para admitir múltiples sistemas de compilación. Este cambio afecta a los desarrolladores que crean herramientas NCBI SRA desde el código fuente. Ya no se admiten archivos MAKE ni sistemas de compilación antiguos.
Este cambio también incluye la estructura de los repositorios de GitHub, que se consolidaron para proporcionar un entorno más sencillo para crear herramientas y bibliotecas (las bibliotecas y dependencias NGS están consolidadas). La consolidación de bibliotecas y dependencias de NGS proporciona un mejor aislamiento del alcance de uso y hace que la construcción sea más sencilla.
ncbi/ngs
Este repositorio está congelado. Todo el desarrollo futuro se llevará a cabo en el repositorio de GitHub ncbi/sra-tools (este repositorio), en el subdirectorio ngs/
.
ncbi/ncbi-vdb
El sistema de compilación de este proyecto se basa en CMake. Las bibliotecas que brindan acceso a datos SRA en formato VDB a través de la API NGS se han trasladado al repositorio de GitHub ncbi/sra-tools.
Antiguo (URL base: https://github.com/ncbi/ncbi-vdb) | Nuevo (URL base: https://github.com/ncbi/sra-tools) |
---|---|
libs/ngs | ngs/ncbi/ngs |
libs/ngs-c++ | ngs/ncbi/ngs-c++ |
libs/ngs-jni | ngs/ncbi/ngs-jni |
libs/ngs-py | ngs/ncbi/ngs-py |
libs/vdb-sqlite | libs/vdb-sqlite |
test/ngs-java | test/ngs-java |
test/ngs-python | test/ngs-python |
ncbi/sra-tools (Este repositorio)
El sistema de compilación de este proyecto se basa en CMake. El proyecto adquirió algunos componentes nuevos, como se enumera en la tabla anterior.
25 de octubre de 2021. Conjunto de herramientas SRA 2.11.3:
Se corrigió un error en fasta-dump: los parámetros fasta y fasta-unsorted funcionan correctamente.
7 de octubre de 2021. Conjunto de herramientas SRA 2.11.2:
Los datos de SRA ahora están disponibles con puntajes de calidad básicos completos (formato normalizado SRA) o con puntajes de calidad simplificados (SRA Lite), según las preferencias del usuario. Ambos formatos se pueden transmitir bajo demanda a los mismos tipos de archivos (fastq, sam, etc.), por lo que ambos son compatibles con flujos de trabajo y aplicaciones existentes que esperan niveles de calidad. Sin embargo, el formato SRA Lite es mucho más pequeño, lo que permite reducir el espacio de almacenamiento y los tiempos de transferencia de datos, lo que permite que los volcados se completen más rápidamente. El kit de herramientas SRA utiliza de forma predeterminada el formato normalizado SRA que incluye puntajes de calidad completos por base, pero los usuarios que no requieren puntajes de calidad base completos para su análisis pueden solicitar la versión SRA Lite para ahorrar tiempo en sus transferencias de datos. Para solicitar los datos de SRA Lite cuando utilice el kit de herramientas SRA, configure la opción "Preferir archivos SRA Lite con puntuaciones de calidad base simplificadas" en la página principal de la configuración del kit de herramientas; esto indicará a las herramientas que utilicen preferentemente el formato SRA Lite cuando esté disponible ( asegúrese de utilizar la versión 2.11.2 o posterior del kit de herramientas para acceder a esta función). Los puntajes de calidad generados a partir de archivos SRA Lite serán los mismos para cada base dentro de una lectura determinada (calidad = 30 o 3, dependiendo de si el indicador de filtro de lectura está configurado en "aprobado" o "rechazado"). Los datos en el formato normalizado SRA con puntuaciones de calidad de base completa seguirán teniendo una extensión de archivo .sra, mientras que los archivos SRA Lite tienen una extensión de archivo .sralite. Para obtener más información, consulte nuestra página de formato de datos.
17 de agosto de 2021: Kit de herramientas SRA 2.11.1.
15 de marzo de 2021: Kit de herramientas SRA 2.11.0.
16 de diciembre de 2020: Kit de herramientas SRA 2.10.9.
29 de junio de 2020: Kit de herramientas SRA 2.10.8.
20 de mayo de 2020: Kit de herramientas SRA 2.10.7.
18 de mayo de 2020: Kit de herramientas SRA 2.10.6.
1 de abril de 2020: Kit de herramientas SRA 2.10.5.
26 de febrero de 2020: Kit de herramientas SRA 2.10.4.
18 de febrero de 2020: Kit de herramientas SRA 2.10.3.
La versión 2.10.2 de sra-tools
proporciona acceso a todos los dbGaP públicos y de acceso controlado de SRA en los entornos AWS y GCP (Linux solo para esta versión) . Se puede acceder y calcular el formato de envío original de este vasto archivo y los datos formateados en SRA en estas nubes, lo que elimina la necesidad de descargar desde NCBI FTP y mejora el rendimiento.
La herramienta prefetch
también recupera archivos de envío originales además de datos ETL para datos dbGaP públicos y de acceso controlado.
Con la versión 2.10.0 de sra-tools
agregamos operación nativa de la nube para entornos AWS y GCP (Linux solo para esta versión) , para usar con la SRA pública. prefetch
es capaz de recuperar archivos de envío originales además de datos ETL.
Con la versión 2.9.1 de sra-tools
finalmente hemos puesto a disposición la herramienta fasterq-dump
, un reemplazo de la herramienta fastq-dump
mucho más antigua. Como su nombre lo indica, se ejecuta más rápido y es más adecuado para la conversión a gran escala de objetos SRA en archivos FASTQ que son comunes en sitios con suficiente espacio en disco para archivos temporales. fasterq-dump
es multiproceso y realiza uniones masivas de una manera que mejora el rendimiento en comparación con fastq-dump
, que realiza uniones por registro (y es de un solo subproceso) .
fastq-dump
todavía es compatible ya que maneja más casos extremos que fasterq-dump
, pero es probable que quede obsoleto en el futuro.
Puede obtener más información sobre fasterq-dump
en nuestra Wiki en https://github.com/ncbi/sra-tools/wiki/HowTo:-fasterq-dump.
Para obtener información adicional sobre el uso, la configuración y la creación del kit de herramientas, visite nuestra wiki o nuestro sitio web en NCBI.
Equipo de desarrollo del kit de herramientas SRA