e-mail : [email protected]
Visitez notre page de téléchargement pour les binaires prédéfinis.
Veuillez vérifier le fichier CHANGES.md pour connaître l'historique des modifications.
La boîte à outils et le SDK SRA de NCBI sont une collection d'outils et de bibliothèques permettant d'utiliser les données des archives de lecture de séquence INSDC.
21 mai 2024 : SRA Toolkit version 3.1.1
Amélioration des messages d'erreur et d'information de prélecture pour les utilisateurs.
Correction d'erreurs et d'avertissements lors de la construction sous Windows.
5 mars 2024 : SRA Toolkit version 3.1.0
L'utilisation de prefetch --eliminate-quals téléchargera désormais les données SRA Lite ou signalera qu'une version Lite n'est pas disponible.
Fréquence réduite des délais d'attente globaux pour les utilisateurs du cloud.
vdb-validate signalera une erreur si les sommes de contrôle des données (blob) sont manquantes.
Ajout du support pour AlmaLinux.
Correction du blocage sur macOS et BSD.
19 décembre 2023 : SRA Toolkit version 3.0.10
Correction d'un bug lors de l'utilisation de JWT avec du stockage cloud.
Ajout du support de build pour les processeurs arm64.
29 août 2023 : Boîte à outils SRA 3.0.7
Vdb-config mis à jour pour améliorer l'interface des informations d'identification AWS et leur utilisation par SRA Toolkit.
Correction d'un bug dans les informations d'identification AWS avec prélecture.
Correction d'un bug entraînant des messages « référence non trouvée » pour les séquences de référence stockées dans une exécution.
10 juillet 2023 : Boîte à outils SRA 3.0.6
Prefetch prend désormais en charge les derniers jetons d'accès GCP.
Correction d'un bug dans vdb-config pour les utilisateurs Windows.
Pour garantir la sortie des lectures techniques, fastq-dump passera désormais automatiquement en mode --split-files si l'option --include-technical est utilisée.
9 mai 2023 : Boîte à outils SRA 3.0.5
Ajout de la prise en charge de PacBio pour fastq-dump.
Ajout de fonctionnalités pour générer des séquences de référence vers un dump plus rapide.
Correction d'un bug dans l'accès aux données dbGaP lors de l'utilisation de fichiers ngc.
3 janvier 2023 : Boîte à outils SRA 3.0.3
Correction d'une régression dans sra-stat.
12 décembre 2022 : Boîte à outils SRA 3.0.2
Correction de l'échec du « tampon insuffisant lors de la conversion de la chaîne dans le module de texte » pour la prélecture sur Mac.
15 novembre 2022 : Boîte à outils SRA 3.0.1
Suppression de l'exigence interactive pour configurer SRA Toolkit.
Modifications apportées à la structure du référentiel :
Pour mieux servir des groupes disparates d'utilisateurs, le répertoire tools/ du référentiel sra-tools est divisé en plusieurs sous-répertoires :
external/ - les outils qui composent l'utilisateur final face à sra-toolkit. Il s'agit des outils installés sur la machine d'un utilisateur de la boîte à outils. C'est la cible de création par défaut
interne/ - les outils orientés vers les développeurs de la boîte à outils et les utilisateurs internes du NCBI
loaders/ - les outils utilisés dans les pipelines de chargement d'archives, tels que le NCBI SRA
test-tools/ - les outils utilisés dans les tests internes au NCBI de la boîte à outils.
La commande par défaut 'make' ne construira désormais que les outils externes. Pour créer d'autres catégories d'outils, utilisez ces cibles/drapeaux :
'make all' - pour tout construire, y compris les projets de test (situés dans sra-tools/test/)
'make BUILD_TOOLS_INTERNAL=ON' - pour construire les outils externes et internes
'make BUILD_TOOLS_LOADERS=ON' - pour construire les outils externes et les chargeurs
'make BUILD_TOOLS_TEST_TOOLS=ON' - pour construire les outils externes et les outils de test
'make TOOLS_ONLY=ON' - pour ignorer la construction des projets de test
Les indicateurs de construction présentés ci-dessus peuvent être combinés sur la même ligne de commande, par exemple 'make BUILD_TOOLS_LOADERS=ON BUILD_TOOLS_INTERNAL=ON TOOLS_ONLY=ON' construira tout sauf les outils de test et les projets de test.
4 août 2022 : Mise à jour de sécurité
En raison de la sécurité mise à jour chez NCBI, les versions de SRA Toolkit 2.9.6 et antérieures ne pourront plus se connecter au service de localisation de données NCBI. Nous conseillons aux utilisateurs concernés de mettre à jour vers la dernière version de SRA Toolkit.
10 février 2022 : Boîte à outils SRA 3.0.0
Le SRA du NCBI a modifié le système de génération de sources pour utiliser CMake dans la version 3.0.0 de la boîte à outils. Ce changement constitue une étape importante pour améliorer la productivité des développeurs car il fournit un accès multiplateforme unifié pour prendre en charge plusieurs systèmes de build. Ce changement affecte les développeurs qui créent des outils NCBI SRA à partir des sources. Les anciens makefiles et systèmes de build ne sont plus pris en charge.
Ce changement inclut également la structure des référentiels GitHub, qui ont subi une consolidation pour fournir un environnement plus simple pour la création d'outils et de bibliothèques (les bibliothèques NGS et les dépendances sont consolidées). La consolidation des bibliothèques et des dépendances NGS offre une meilleure isolation de la portée d'utilisation et rend la construction plus simple.
ncbi/ngs
Ce référentiel est gelé. Tous les développements futurs auront lieu dans le référentiel GitHub ncbi/sra-tools (ce référentiel), sous le sous-répertoire ngs/
.
ncbi/ncbi-vdb
Le système de construction de ce projet est basé sur CMake. Les bibliothèques donnant accès aux données SRA au format VDB via l'API NGS ont été déplacées vers le référentiel GitHub ncbi/sra-tools.
Ancien (URL de base : https://github.com/ncbi/ncbi-vdb) | Nouveau (URL de base : https://github.com/ncbi/sra-tools) |
---|---|
libs/ngs | ngs/ncbi/ngs |
libs/ngs-c++ | ngs/ncbi/ngs-c++ |
libs/ngs-jni | ngs/ncbi/ngs-jni |
libs/ngs-py | ngs/ncbi/ngs-py |
libs/vdb-sqlite | libs/vdb-sqlite |
test/ngs-java | test/ngs-java |
test/ngs-python | test/ngs-python |
ncbi/sra-tools (Ce référentiel)
Le système de construction de ce projet est basé sur CMake. Le projet a acquis quelques nouvelles composantes, comme indiqué dans le tableau ci-dessus.
25 octobre 2021. Boîte à outils SRA 2.11.3 :
correction d'un bug dans fasta-dump : les paramètres fasta et fasta-unsorted fonctionnent correctement.
7 octobre 2021. Boîte à outils SRA 2.11.2 :
Les données SRA sont désormais disponibles soit avec des scores de qualité de base complets (format SRA normalisé), soit avec des scores de qualité simplifiés (SRA Lite), selon les préférences de l'utilisateur. Les deux formats peuvent être diffusés à la demande sur les mêmes types de fichiers (fastq, sam, etc.), ils sont donc tous deux compatibles avec les flux de travail et les applications existants qui attendent des scores de qualité. Cependant, le format SRA Lite est beaucoup plus petit, ce qui permet de réduire l'encombrement du stockage et les temps de transfert de données, permettant ainsi aux sauvegardes de s'effectuer plus rapidement. La boîte à outils SRA utilise par défaut le format normalisé SRA qui inclut des scores de qualité complets par base, mais les utilisateurs qui n'ont pas besoin de scores de qualité de base complets pour leur analyse peuvent demander la version SRA Lite pour gagner du temps sur leurs transferts de données. Pour demander les données SRA Lite lors de l'utilisation de la boîte à outils SRA, définissez l'option « Préférer les fichiers SRA Lite avec des scores de qualité de base simplifiés » sur la page principale de la configuration de la boîte à outils - cela demandera aux outils d'utiliser préférentiellement le format SRA Lite lorsqu'il est disponible ( veuillez vous assurer d'utiliser la version 2.11.2 ou ultérieure du kit d'outils pour accéder à cette fonctionnalité). Les scores de qualité générés à partir des fichiers SRA Lite seront les mêmes pour chaque base au sein d'une lecture donnée (qualité = 30 ou 3, selon que l'indicateur du filtre de lecture est défini sur « réussite » ou « rejeter »). Les données au format normalisé SRA avec des scores de qualité de base complets continueront à avoir une extension de fichier .sra, tandis que les fichiers SRA Lite auront une extension de fichier .sralite. Pour plus d’informations, veuillez consulter notre page sur le format des données.
17 août 2021 : boîte à outils SRA 2.11.1.
15 mars 2021 : boîte à outils SRA 2.11.0.
16 décembre 2020 : Boîte à outils SRA 2.10.9.
29 juin 2020 : Boîte à outils SRA 2.10.8.
20 mai 2020 : Boîte à outils SRA 2.10.7.
18 mai 2020 : Boîte à outils SRA 2.10.6.
1er avril 2020 : Boîte à outils SRA 2.10.5.
26 février 2020 : Boîte à outils SRA 2.10.4.
18 février 2020 : Boîte à outils SRA 2.10.3.
La version 2.10.2 de sra-tools
donne accès à tous les dbGaP publics et à accès contrôlé de SRA dans les environnements AWS et GCP (Linux uniquement pour cette version) . Le format de soumission original de cette vaste archive et les données au format SRA peuvent être consultés et calculés sur ces nuages, éliminant ainsi le besoin de téléchargement à partir du FTP NCBI et améliorant les performances.
L'outil prefetch
récupère également les fichiers de soumission originaux en plus des données ETL pour les données dbGaP publiques et à accès contrôlé.
Avec la version 2.10.0 de sra-tools
nous avons ajouté un fonctionnement cloud natif pour les environnements AWS et GCP (Linux uniquement pour cette version) , à utiliser avec le SRA public. prefetch
est capable de récupérer les fichiers de soumission originaux en plus des données ETL.
Avec la version 2.9.1 de sra-tools
nous avons enfin mis à disposition l'outil fasterq-dump
, un remplacement de l'outil fastq-dump
beaucoup plus ancien. Comme son nom l'indique, il s'exécute plus rapidement et convient mieux à la conversion à grande échelle d'objets SRA en fichiers FASTQ, courants sur les sites disposant de suffisamment d'espace disque pour les fichiers temporaires. fasterq-dump
est multithread et effectue des jointures groupées d'une manière qui améliore les performances par rapport à fastq-dump
, qui effectue des jointures par enregistrement (et est monothread) .
fastq-dump
est toujours pris en charge car il gère plus de cas particuliers que fasterq-dump
, mais il sera probablement obsolète à l'avenir.
Vous pouvez obtenir plus d'informations sur fasterq-dump
dans notre wiki à l'adresse https://github.com/ncbi/sra-tools/wiki/HowTo:-fasterq-dump.
Pour plus d'informations sur l'utilisation, la configuration et la création de la boîte à outils, veuillez visiter notre wiki ou notre site Web à NCBI.
Équipe de développement de la boîte à outils SRA