e-mail: [email protected]
Visite nossa página de download para binários pré-construídos.
Verifique o arquivo CHANGES.md para obter o histórico de alterações.
O SRA Toolkit and SDK do NCBI é uma coleção de ferramentas e bibliotecas para usar dados nos arquivos de leitura de sequência INSDC.
21 de maio de 2024 : Versão 3.1.1 do kit de ferramentas SRA
Mensagens de informações e erros de pré-busca aprimoradas para os usuários.
Erros e avisos corrigidos ao compilar no Windows.
5 de março de 2024 : Kit de ferramentas SRA versão 3.1.0
Usar prefetch --eliminate-quals agora fará o download dos dados do SRA Lite ou informará que uma versão Lite não está disponível.
Frequência reduzida de tempos limite globais para usuários da nuvem.
vdb-validate reportará um erro se as somas de verificação de dados (blob) estiverem faltando.
Adicionado suporte para AlmaLinux.
Corrigido travamento no macOS e BSD.
19 de dezembro de 2023 : Kit de ferramentas SRA versão 3.0.10
Corrigido um bug no uso do JWT com algum armazenamento em nuvem.
Adicionado suporte de compilação para processadores arm64.
29 de agosto de 2023 : Kit de ferramentas SRA 3.0.7
Vdb-config atualizado para melhorar a interface de credenciais da AWS e o uso pelo SRA Toolkit.
Corrigido um bug nas credenciais da AWS com pré-busca.
Corrigido um bug que resultava em mensagens de 'referência não encontrada' para sequências de referência armazenadas dentro de uma execução.
10 de julho de 2023 : Kit de ferramentas SRA 3.0.6
A pré-busca agora oferece suporte aos tokens de acesso mais recentes do GCP.
Corrigido um bug no vdb-config para usuários do Windows.
Para garantir a saída de leituras técnicas, o fastq-dump agora mudará automaticamente para o modo --split-files se a opção --include-technical for usada.
9 de maio de 2023 : Kit de ferramentas SRA 3.0.5
Adicionado suporte para PacBio para quickq-dump.
Adicionados recursos para gerar sequências de referência para q-dump mais rápido.
Corrigido um bug no acesso a dados dbGaP ao usar arquivos ngc.
3 de janeiro de 2023 : Kit de ferramentas SRA 3.0.3
Corrigida uma regressão no sra-stat.
12 de dezembro de 2022 : Kit de ferramentas SRA 3.0.2
Corrigida a falha de 'buffer insuficiente ao converter string no módulo de texto' para pré-busca no Mac.
15 de novembro de 2022 : Kit de ferramentas SRA 3.0.1
Remoção do requisito interativo para configurar o SRA Toolkit.
Mudanças na estrutura do repositório:
Para melhor atender grupos distintos de usuários, o diretório tools/ do repositório sra-tools é dividido em vários subdiretórios:
external/ - as ferramentas que compõem o sra-toolkit voltado para o usuário final. Estas são as ferramentas instaladas na máquina do usuário do kit de ferramentas. Este é o alvo padrão
interno/ - as ferramentas orientadas para os desenvolvedores do kit de ferramentas e usuários internos do NCBI
loaders/ - as ferramentas usadas em pipelines de carregamento de arquivos, como o NCBI SRA
test-tools/ - as ferramentas usadas nos testes internos do NCBI do kit de ferramentas.
O comando padrão 'make' agora criará apenas as ferramentas externas. Para construir outras categorias de ferramentas, use estes alvos/sinalizadores:
'make all' - para construir tudo, incluindo os projetos de teste (localizados em sra-tools/test/)
'make BUILD_TOOLS_INTERNAL=ON' - para construir as ferramentas externas e internas
'make BUILD_TOOLS_LOADERS=ON' - para construir as ferramentas externas e os carregadores
'make BUILD_TOOLS_TEST_TOOLS=ON' - para construir as ferramentas externas e as ferramentas de teste
'make TOOLS_ONLY=ON' - para pular a construção dos projetos de teste
Os sinalizadores de construção mostrados acima podem ser combinados na mesma linha de comando, por exemplo 'make BUILD_TOOLS_LOADERS=ON BUILD_TOOLS_INTERNAL=ON TOOLS_ONLY=ON' irá construir tudo, exceto as ferramentas de teste e os projetos de teste.
4 de agosto de 2022 : atualização de segurança
Devido à segurança atualizada no NCBI, as versões do SRA Toolkit 2.9.6 e anteriores não poderão mais se conectar ao serviço de localização de dados do NCBI. Aconselhamos os usuários afetados a atualizarem para a versão mais recente do SRA Toolkit.
10 de fevereiro de 2022 : Kit de ferramentas SRA 3.0.0
O SRA do NCBI mudou o sistema de compilação de origem para usar CMake na versão 3.0.0 do kit de ferramentas. Esta mudança é um passo importante para melhorar a produtividade dos desenvolvedores, pois fornece acesso unificado entre plataformas para suportar vários sistemas de construção. Esta mudança afeta os desenvolvedores que criam ferramentas NCBI SRA a partir da fonte. Makefiles e sistemas de compilação antigos não são mais suportados.
Essa mudança também inclui a estrutura dos repositórios GitHub, que passaram por consolidação para fornecer um ambiente mais fácil para a construção de ferramentas e bibliotecas (libs e dependências NGS são consolidadas). A consolidação de bibliotecas e dependências NGS fornece melhor isolamento do escopo de uso e torna a construção mais simples.
ncbi/ngs
Este repositório está congelado. Todo o desenvolvimento futuro ocorrerá no repositório GitHub ncbi/sra-tools (este repositório), no subdiretório ngs/
.
ncbi/ncbi-vdb
O sistema de construção deste projeto é baseado no CMake. As bibliotecas que fornecem acesso aos dados SRA no formato VDB por meio da API NGS foram movidas para o repositório GitHub ncbi/sra-tools.
Antigo (URL base: https://github.com/ncbi/ncbi-vdb) | Novo (URL base: https://github.com/ncbi/sra-tools) |
---|---|
libs/ngs | ngs/ncbi/ngs |
libs/ngs-c++ | ngs/ncbi/ngs-c++ |
libs/ngs-jni | ngs/ncbi/ngs-jni |
libs/ngs-py | ngs/ncbi/ngs-py |
libs/vdb-sqlite | libs/vdb-sqlite |
test/ngs-java | test/ngs-java |
test/ngs-python | test/ngs-python |
ncbi/sra-tools (este repositório)
O sistema de construção deste projeto é baseado no CMake. O projeto adquiriu alguns novos componentes, listados na tabela acima.
25 de outubro de 2021. Kit de ferramentas SRA 2.11.3:
corrigido um bug no fasta-dump: os parâmetros fasta e fasta-unsorted funcionam corretamente.
7 de outubro de 2021. Kit de ferramentas SRA 2.11.2:
Os dados SRA agora estão disponíveis com índices de qualidade básicos completos (SRA Normalized Format) ou com índices de qualidade simplificados (SRA Lite), dependendo da preferência do usuário. Ambos os formatos podem ser transmitidos sob demanda para os mesmos tipos de arquivo (fastq, sam, etc.), portanto, ambos são compatíveis com fluxos de trabalho e aplicativos existentes que exigem índices de qualidade. No entanto, o formato SRA Lite é muito menor, permitindo uma redução no espaço de armazenamento e nos tempos de transferência de dados, permitindo que os dumps sejam concluídos mais rapidamente. O kit de ferramentas SRA usa como padrão o formato normalizado SRA, que inclui pontuações de qualidade completas por base, mas os usuários que não exigem pontuações de qualidade básicas completas para suas análises podem solicitar a versão SRA Lite para economizar tempo em suas transferências de dados. Para solicitar os dados SRA Lite ao usar o kit de ferramentas SRA, defina a opção "Preferir arquivos SRA Lite com índices de qualidade de base simplificados" na página principal da configuração do kit de ferramentas - isso instruirá as ferramentas a usar preferencialmente o formato SRA Lite quando disponível ( certifique-se de usar o kit de ferramentas versão 2.11.2 ou posterior para acessar esse recurso). As pontuações de qualidade geradas a partir dos arquivos SRA Lite serão as mesmas para cada base em uma determinada leitura (qualidade = 30 ou 3, dependendo se o sinalizador do Filtro de Leitura estiver definido como 'aprovado' ou 'rejeitado'). Os dados no formato normalizado SRA com pontuações de qualidade de base completas continuarão a ter uma extensão de arquivo .sra, enquanto os arquivos SRA Lite terão uma extensão de arquivo .sralite. Para obter mais informações, consulte nossa página de formato de dados.
17 de agosto de 2021: Kit de ferramentas SRA 2.11.1.
15 de março de 2021: Kit de ferramentas SRA 2.11.0.
16 de dezembro de 2020: Kit de ferramentas SRA 2.10.9.
29 de junho de 2020: Kit de ferramentas SRA 2.10.8.
20 de maio de 2020: Kit de ferramentas SRA 2.10.7.
18 de maio de 2020: Kit de ferramentas SRA 2.10.6.
1º de abril de 2020: Kit de ferramentas SRA 2.10.5.
26 de fevereiro de 2020: Kit de ferramentas SRA 2.10.4.
18 de fevereiro de 2020: Kit de ferramentas SRA 2.10.3.
A versão 2.10.2 do sra-tools
fornece acesso a todos os dbGaP de acesso público e controlado do SRA nos ambientes AWS e GCP (Linux apenas para esta versão) . O formato original de envio deste vasto arquivo e os dados formatados em SRA podem ser acessados e computados nessas nuvens, eliminando a necessidade de download do FTP do NCBI e melhorando o desempenho.
A ferramenta prefetch
também recupera arquivos de envio originais , além de dados ETL para dados dbGaP de acesso público e controlado.
Com a versão 2.10.0 do sra-tools
adicionamos operação nativa da nuvem para ambientes AWS e GCP (Linux apenas para esta versão) , para uso com o SRA público. prefetch
é capaz de recuperar arquivos originais de envio, além de dados ETL.
Com a versão 2.9.1 do sra-tools
finalmente disponibilizamos a ferramenta fasterq-dump
, um substituto para a ferramenta muito mais antiga fastq-dump
. Como o próprio nome indica, ele é executado mais rapidamente e é mais adequado para conversão em larga escala de objetos SRA em arquivos FASTQ, comuns em sites com espaço em disco suficiente para arquivos temporários. fasterq-dump
é multithread e executa junções em massa de uma forma que melhora o desempenho em comparação com fastq-dump
, que executa junções por registro (e é de thread único) .
fastq-dump
ainda é suportado, pois lida com mais casos extremos do que fasterq-dump
, mas é provável que seja descontinuado no futuro.
Você pode obter mais informações sobre fasterq-dump
em nosso Wiki em https://github.com/ncbi/sra-tools/wiki/HowTo:-fasterq-dump.
Para obter informações adicionais sobre como usar, configurar e construir o kit de ferramentas, visite nosso wiki ou nosso site em NCBI
Equipe de desenvolvimento do kit de ferramentas SRA