Coleção de bibliotecas Python para analisar arquivos de bioinformática ou realizar cálculos relacionados à montagem, anotação e genômica comparativa.
Autores | Haibao Tang (tanghaibao) |
Vivek Krishnakumar (vivekkrish) | |
Xingtan Zhang (tangerzhang) | |
Ganhou Cheol Yim (wyim-pgl) | |
[email protected] | |
Licença | BSD |
Dica
JCVI agora está publicado no iMeta!
Tang et al. (2024) JCVI: Um kit de ferramentas versátil para análise genômica comparativa. iMeta
Os módulos a seguir estão disponíveis como métodos genéricos de manuseio de Bioinformática.
algoritmos
aplicativos
formatos
Atualmente suporta formato .ace
(phrap, cap3, etc.), .agp
(goldenpath), formato .bed
, saída .blast
, formato .btab
, formato .coords
(saída nucmer
), formato .fasta
, formato .fastq
, .fpc
formato, formato .gff
, formato obo
(ontologia), formato .psl
(UCSC blat, GMAP, etc.), formato .posmap
(saída do Celera assembler), formato .sam
(mapeamento de leitura), formato .contig
(formato de montagem TIGR) , etc.
gráficos
utilitários
Depois, há módulos que contêm métodos específicos de domínio.
conjunto
anotação
comparar
Visite o wiki para aplicativos completos.
A seguir está uma lista de pacotes python de terceiros que são usados por algumas rotinas na biblioteca. Essas dependências não são obrigatórias, pois são utilizadas apenas por alguns módulos.
Existem outros módulos Python aqui e ali em vários scripts. A melhor maneira é instalá-los via pip install
quando você vir ImportError
.
A maneira mais fácil é instalá-lo via PyPI:
pip install jcvi
Para instalar a versão de desenvolvimento:
pip install git+git://github.com/tanghaibao/jcvi.git
Alternativamente, se você deseja instalar manualmente:
cd ~/code # or any directory of your choice
git clone git://github.com/tanghaibao/jcvi.git
pip install -e .
Além disso, alguns módulos podem solicitar localizações de programas externos, se o estendido não puder ser encontrado em seu PATH
. Os programas externos frequentemente usados são:
A maioria dos scripts deste pacote contém múltiplas ações. Para usar o exemplo fasta
:
Usage:
python -m jcvi.formats.fasta ACTION
Available ACTIONs:
clean | Remove irregular chars in FASTA seqs
diff | Check if two fasta records contain same information
extract | Given fasta file and seq id, retrieve the sequence in fasta format
fastq | Combine fasta and qual to create fastq file
filter | Filter the records by size
format | Trim accession id to the first space or switch id based on 2-column mapping file
fromtab | Convert 2-column sequence file to FASTA format
gaps | Print out a list of gap sizes within sequences
gc | Plot G+C content distribution
identical | Given 2 fasta files, find all exactly identical records
ids | Generate a list of headers
info | Run `sequence_info` on fasta files
ispcr | Reformat paired primers into isPcr query format
join | Concatenate a list of seqs and add gaps in between
longestorf | Find longest orf for CDS fasta
pair | Sort paired reads to .pairs, rest to .fragments
pairinplace | Starting from fragment.fasta, find if adjacent records can form pairs
pool | Pool a bunch of fastafiles together and add prefix
qual | Generate dummy .qual file based on FASTA file
random | Randomly take some records
sequin | Generate a gapped fasta file for sequin submission
simulate | Simulate random fasta file for testing
some | Include or exclude a list of records (also performs on .qual file if available)
sort | Sort the records by IDs, sizes, etc.
summary | Report the real no of bases and N's in fasta files
tidy | Normalize gap sizes and remove small components in fasta
translate | Translate CDS to proteins
trim | Given a cross_match screened fasta, trim the sequence
trimsplit | Split sequences at lower-cased letters
uniq | Remove records that are the same
Então você precisa usar uma ação, basta fazer:
python -m jcvi.formats.fasta extract
Isso lhe dirá as opções e argumentos que espera.
Fique à vontade para conferir outros scripts do pacote, não é só para FASTA.