Varus foi originalmente escrito por Willy Bruhn como uma tese de bacharels supervisionada por Mario Stanke. Este repositório é uma cópia de https://github.com/willybruhn/varus feita em novembro de 2018 e contém muitas correntes, um recurso incremental de banco de dados de íntron e uma extensão para o uso do programa de alinhamento alternativo Hisat al.
A Varus automatiza a seleção e o download de um número limitado de leituras de RNA-seq da sequência do NCBI Read Archive (SRA) direcionada a uma cobertura suficientemente alta para muitos genes para fins de treinamento de gênios e anotações. Cada iteração do algoritmo online
Invoque o seguinte comando da linha de comando para clonar o repositório:
git clone https://github.com/MarioStanke/VARUS.git
Varus depende
sudo apt-get install bamtools libbamtools-dev
Compilar Varus manualmente com
cd Implementation
make
Por padrão, a ferramenta NCBI fastq-dump
cria arquivos temporários em ~/ncbi
do mesmo tamanho que o arquivo de execução do qual os dados são baixados, mesmo que apenas uma pequena parte do mesmo seja baixada. Desative esse comportamento de armazenamento em cache que requer provavelmente muito espaço de disco rígido para a maioria dos usuários com
mkdir -p ~/.ncbi
echo '/repository/user/cache-disabled = "true"' >> ~/.ncbi/user-settings.mkfg
Altere o example
do diretório e siga as instruções no exemplo/leitura.
Copie o arquivo VARUSparameters.txt
da pasta Exemplo para o seu diretório de trabalho e ajuste -o, se necessário:
Parâmetros mais importantes:
-BatchSize Especifica quantas leituras devem ser baixadas em cada iteração (por exemplo, 50000 ou 200000)
-Maxbatches especifica quantos lotes devem ser baixados no máximo
A saída final é um arquivo de alinhamento emendado classificado (todos os lotes juntos) chamado varus.bam .
Cite: Varus: Amostragem de RNA complementares leituras do arquivo de leitura de sequência. 2019; BMC Bioinformatics , 20: 558
Encontre a tese de bacharel de Willy Bruhn correspondente a Varus in /docs /tese.