E-Mail: [email protected]
Besuchen Sie unsere Download-Seite für vorgefertigte Binärdateien.
Bitte überprüfen Sie die Datei CHANGES.md auf den Änderungsverlauf.
Das SRA Toolkit und SDK von NCBI ist eine Sammlung von Tools und Bibliotheken zur Verwendung von Daten in den INSDC Sequence Read Archives.
21. Mai 2024 : SRA Toolkit-Version 3.1.1
Verbesserte Prefetch-Fehler- und Informationsmeldungen für Benutzer.
Fehler und Warnungen beim Erstellen unter Windows behoben.
5. März 2024 : SRA Toolkit Release 3.1.0
Durch die Verwendung von prefetch --eliminate-quals werden nun SRA Lite-Daten heruntergeladen oder gemeldet, dass keine Lite-Version verfügbar ist.
Reduzierte Häufigkeit globaler Timeouts für Cloud-Benutzer.
vdb-validate meldet einen Fehler, wenn Datenprüfsummen (Blobs) fehlen.
Unterstützung für AlmaLinux hinzugefügt.
Das Hängenbleiben unter macOS und BSD wurde behoben.
19. Dezember 2023 : SRA Toolkit Release 3.0.10
Ein Fehler bei der Verwendung von JWT mit einigen Cloud-Speichern wurde behoben.
Build-Unterstützung für arm64-Prozessoren hinzugefügt.
29. August 2023 : SRA Toolkit 3.0.7
vdb-config aktualisiert, um die AWS-Anmeldeinformationsschnittstelle und die Verwendung durch das SRA Toolkit zu verbessern.
Ein Fehler in AWS-Anmeldeinformationen mit Prefetch wurde behoben.
Es wurde ein Fehler behoben, der zu Meldungen „Referenz nicht gefunden“ für in einem Lauf gespeicherte Referenzsequenzen führte.
10. Juli 2023 : SRA Toolkit 3.0.6
Prefetch unterstützt jetzt die neuesten GCP-Zugriffstoken.
Ein Fehler in der vdb-config für Windows-Benutzer wurde behoben.
Um die Ausgabe technischer Lesevorgänge sicherzustellen, wechselt Fasterq-Dump jetzt automatisch in den Modus „--split-files“, wenn die Option „--include-technical“ verwendet wird.
9. Mai 2023 : SRA Toolkit 3.0.5
Unterstützung für PacBio zu FasterQ-Dump hinzugefügt.
Funktionen zur Ausgabe von Referenzsequenzen an Fasterq-Dump hinzugefügt.
Ein Fehler beim dbGaP-Datenzugriff bei Verwendung von ngc-Dateien wurde behoben.
3. Januar 2023 : SRA Toolkit 3.0.3
Eine Regression in sra-stat wurde behoben.
12. Dezember 2022 : SRA Toolkit 3.0.2
Der Fehler „Puffer unzureichend beim Konvertieren einer Zeichenfolge innerhalb eines Textmoduls“ beim Vorabruf auf dem Mac wurde behoben.
15. November 2022 : SRA Toolkit 3.0.1
Die interaktive Anforderung zur Konfiguration des SRA Toolkit wurde entfernt.
Änderungen an der Repository-Struktur:
Um unterschiedliche Benutzergruppen besser bedienen zu können, ist das tools/-Verzeichnis des sra-tools-Repositorys in mehrere Unterverzeichnisse unterteilt:
external/ – die Tools, aus denen das Sra-Toolkit für den Endbenutzer besteht. Dies sind die Tools, die auf dem Computer eines Toolkit-Benutzers installiert sind. Dies ist das Standard-Make-Ziel
internal/ – die Tools, die sich an die Entwickler des Toolkits und NCBI-interne Benutzer richten
Loader/ – die Tools, die in Pipelines zum Laden von Archiven verwendet werden, wie z. B. der NCBI SRA
test-tools/ – die Tools, die beim NCBI-internen Testen des Toolkits verwendet werden.
Der Standardbefehl „make“ erstellt jetzt nur die externen Tools. Um andere Werkzeugkategorien zu erstellen, verwenden Sie diese Ziele/Flags:
„make all“ – um alles zu erstellen, einschließlich der Testprojekte (zu finden in sra-tools/test/)
'make BUILD_TOOLS_INTERNAL=ON' – um die externen und internen Tools zu erstellen
'make BUILD_TOOLS_LOADERS=ON' – um die externen Tools und die Loader zu erstellen
'make BUILD_TOOLS_TEST_TOOLS=ON' – um die externen Tools und die Testtools zu erstellen
'make TOOLS_ONLY=ON' – um die Erstellung der Testprojekte zu überspringen
Die oben gezeigten Build-Flags können in derselben Befehlszeile kombiniert werden, zum Beispiel erstellt „make BUILD_TOOLS_LOADERS=ON BUILD_TOOLS_INTERNAL=ON TOOLS_ONLY=ON“ alles außer den Testtools und den Testprojekten.
4. August 2022 : Sicherheitsupdate
Aufgrund der aktualisierten Sicherheit bei NCBI können Versionen des SRA Toolkit 2.9.6 und älter keine Verbindung mehr zum NCBI-Datenortungsdienst herstellen. Wir empfehlen betroffenen Benutzern, auf die neueste Version des SRA Toolkits zu aktualisieren.
10. Februar 2022 : SRA Toolkit 3.0.0
Die SRA von NCBI hat das Quell-Build-System geändert, um CMake in Toolkit-Version 3.0.0 zu verwenden. Diese Änderung ist ein wichtiger Schritt zur Verbesserung der Entwicklerproduktivität, da sie einen einheitlichen plattformübergreifenden Zugriff zur Unterstützung mehrerer Build-Systeme bietet. Diese Änderung betrifft Entwickler, die NCBI-SRA-Tools aus dem Quellcode erstellen. Alte Makefiles und Build-Systeme werden nicht mehr unterstützt.
Diese Änderung umfasst auch die Struktur der GitHub-Repositorys, die einer Konsolidierung unterzogen wurden, um eine einfachere Umgebung für die Erstellung von Tools und Bibliotheken bereitzustellen (NGS-Bibliotheken und Abhängigkeiten werden konsolidiert). Die Konsolidierung von NGS-Bibliotheken und -Abhängigkeiten sorgt für eine bessere Isolierung des Nutzungsbereichs und vereinfacht die Erstellung.
ncbi/ngs
Dieses Repository ist eingefroren. Die gesamte zukünftige Entwicklung wird im GitHub-Repository ncbi/sra-tools (dieses Repository) im Unterverzeichnis ngs/
stattfinden.
ncbi/ncbi-vdb
Das Build-System dieses Projekts basiert auf CMake. Die Bibliotheken, die über die NGS-API Zugriff auf SRA-Daten im VDB-Format bieten, wurden in das GitHub-Repository ncbi/sra-tools verschoben.
Alt (Basis-URL: https://github.com/ncbi/ncbi-vdb) | Neu (Basis-URL: https://github.com/ncbi/sra-tools) |
---|---|
libs/ngs | ngs/ncbi/ngs |
libs/ngs-c++ | ngs/ncbi/ngs-c++ |
libs/ngs-jni | ngs/ncbi/ngs-jni |
libs/ngs-py | ngs/ncbi/ngs-py |
libs/vdb-sqlite | libs/vdb-sqlite |
test/ngs-java | test/ngs-java |
test/ngs-python | test/ngs-python |
ncbi/sra-tools (Dieses Repository)
Das Build-System dieses Projekts basiert auf CMake. Das Projekt erhielt einige neue Komponenten, wie in der Tabelle oben aufgeführt.
25. Oktober 2021. SRA Toolkit 2.11.3:
Es wurde ein Fehler in FasterQ-Dump behoben: Fasta- und Fasta-Unsorted-Parameter funktionieren korrekt.
7. Oktober 2021. SRA Toolkit 2.11.2:
SRA-Daten sind jetzt je nach Benutzerpräferenz entweder mit vollständigen Basisqualitätswerten (SRA Normalized Format) oder mit vereinfachten Qualitätswerten (SRA Lite) verfügbar. Beide Formate können bei Bedarf in die gleichen Dateitypen (fastq, sam usw.) gestreamt werden, sodass sie beide mit bestehenden Arbeitsabläufen und Anwendungen kompatibel sind, die Qualitätswerte erfordern. Allerdings ist das SRA Lite-Format viel kleiner, was eine Reduzierung des Speicherbedarfs und der Datenübertragungszeiten ermöglicht, sodass Dumps schneller abgeschlossen werden können. Das SRA-Toolkit verwendet standardmäßig das SRA-Normalisierte Format, das vollständige Qualitätsbewertungen pro Basis enthält. Benutzer, die für ihre Analyse jedoch keine vollständigen Basisqualitätsbewertungen benötigen, können die SRA Lite-Version anfordern, um bei ihren Datenübertragungen Zeit zu sparen. Um die SRA Lite-Daten bei Verwendung des SRA-Toolkits anzufordern, aktivieren Sie auf der Hauptseite der Toolkit-Konfiguration die Option „SRA Lite-Dateien mit vereinfachten Basisqualitätswerten bevorzugen“. Dadurch werden die Tools angewiesen, vorzugsweise das SRA Lite-Format zu verwenden, sofern verfügbar ( Bitte stellen Sie sicher, dass Sie die Toolkit-Version 2.11.2 oder höher verwenden, um auf diese Funktion zuzugreifen. Die aus SRA Lite-Dateien generierten Qualitätswerte sind für jede Basis innerhalb eines bestimmten Lesevorgangs gleich (Qualität = 30 oder 3, je nachdem, ob das Lesefilter-Flag auf „Bestehen“ oder „Ablehnen“ gesetzt ist). Daten im SRA Normalized Format mit vollständigen Basisqualitätswerten haben weiterhin die Dateierweiterung .sra, während die SRA Lite-Dateien die Dateierweiterung .sralite haben. Weitere Informationen finden Sie auf unserer Datenformatseite.
17. August 2021: SRA Toolkit 2.11.1.
15. März 2021: SRA Toolkit 2.11.0.
16. Dezember 2020: SRA Toolkit 2.10.9.
29. Juni 2020: SRA Toolkit 2.10.8.
20. Mai 2020: SRA Toolkit 2.10.7.
18. Mai 2020: SRA Toolkit 2.10.6.
1. April 2020: SRA Toolkit 2.10.5.
26. Februar 2020: SRA Toolkit 2.10.4.
18. Februar 2020: SRA Toolkit 2.10.3.
Version 2.10.2 von sra-tools
bietet Zugriff auf das gesamte öffentliche und zugriffskontrollierte DBGaP von SRA in den AWS- und GCP-Umgebungen (Linux nur für diese Version) . Auf diese Clouds kann sowohl auf das ursprüngliche Übermittlungsformat dieses riesigen Archivs als auch auf die SRA-formatierten Daten zugegriffen und diese berechnet werden, wodurch ein Herunterladen von NCBI-FTP entfällt und die Leistung verbessert wird.
Das prefetch
Tool ruft zusätzlich zu den ETL-Daten auch die ursprünglichen Übermittlungsdateien für öffentliche und zugriffskontrollierte dbGaP-Daten ab.
Mit Version 2.10.0 von sra-tools
haben wir einen cloudnativen Betrieb für AWS- und GCP-Umgebungen (Linux nur für diese Version) zur Verwendung mit der öffentlichen SRA hinzugefügt. prefetch
ist in der Lage, zusätzlich zu den ETL-Daten auch Original-Übermittlungsdateien abzurufen.
Mit der Version 2.9.1 von sra-tools
haben wir endlich das Tool fasterq-dump
zur Verfügung gestellt, einen Ersatz für das viel ältere Tool fastq-dump
. Wie der Name schon sagt, läuft es schneller und eignet sich besser für die groß angelegte Konvertierung von SRA-Objekten in FASTQ-Dateien, die auf Websites mit ausreichend Speicherplatz für temporäre Dateien üblich sind. fasterq-dump
ist multithreaded und führt Massenverknüpfungen auf eine Art und Weise durch, die die Leistung im Vergleich zu fastq-dump
verbessert, das Verknüpfungen pro Datensatz ausführt (und Singlethreading ist) .
fastq-dump
wird weiterhin unterstützt, da es mehr Eckfälle verarbeitet als fasterq-dump
, aber es wird wahrscheinlich in Zukunft veraltet sein.
Weitere Informationen zu fasterq-dump
erhalten Sie in unserem Wiki unter https://github.com/ncbi/sra-tools/wiki/HowTo:-fasterq-dump.
Weitere Informationen zur Verwendung, Konfiguration und Erstellung des Toolkits finden Sie in unserem Wiki oder auf unserer Website bei NCBI
SRA Toolkit-Entwicklungsteam