Colección de bibliotecas de Python para analizar archivos bioinformáticos o realizar cálculos relacionados con el ensamblaje, la anotación y la genómica comparativa.
Autores | Haibao Tang (tanghaibao) |
Vivek Krishnakumar (vivekkrish) | |
Xingtan Zhang (tangerzhang) | |
Won Cheol Yim (wyim-pgl) | |
Correo electrónico | [email protected] |
Licencia | BSD |
Consejo
¡JCVI ya está publicado en iMeta!
Tang y cols. (2024) JCVI: un conjunto de herramientas versátil para el análisis genómico comparativo. iMeta
Los siguientes módulos están disponibles como métodos genéricos de manejo de bioinformática.
algoritmos
aplicaciones
formatos
Actualmente admite el formato .ace
(phrap, cap3, etc.), .agp
(goldenpath), formato .bed
, salida .blast
, formato .btab
, formato .coords
(salida nucmer
), formato .fasta
, formato .fastq
, .fpc
formato, formato .gff
, formato obo
(ontología), formato .psl
(UCSC blat, GMAP, etc.), formato .posmap
(salida del ensamblador Celera), formato .sam
(mapeo de lectura), formato .contig
(formato ensamblador TIGR) , etc.
gráficos
utiles
Luego están los módulos que contienen métodos específicos de dominio.
asamblea
anotación
comparar
Visite la wiki para ver aplicaciones completas.
A continuación se muestra una lista de paquetes de Python de terceros que utilizan algunas rutinas de la biblioteca. Estas dependencias no son obligatorias ya que solo las utilizan unos pocos módulos.
Hay otros módulos de Python aquí y allá en varios scripts. La mejor manera es instalarlos mediante pip install
cuando vea ImportError
.
La forma más sencilla es instalarlo mediante PyPI:
pip install jcvi
Para instalar la versión de desarrollo:
pip install git+git://github.com/tanghaibao/jcvi.git
Alternativamente, si desea instalar manualmente:
cd ~/code # or any directory of your choice
git clone git://github.com/tanghaibao/jcvi.git
pip install -e .
Además, algunos módulos pueden solicitar ubicaciones de programas externos, si el extendido no se puede encontrar en su PATH
. Los programas externos que se suelen utilizar son:
La mayoría de los scripts de este paquete contienen múltiples acciones. Para usar el ejemplo fasta
:
Usage:
python -m jcvi.formats.fasta ACTION
Available ACTIONs:
clean | Remove irregular chars in FASTA seqs
diff | Check if two fasta records contain same information
extract | Given fasta file and seq id, retrieve the sequence in fasta format
fastq | Combine fasta and qual to create fastq file
filter | Filter the records by size
format | Trim accession id to the first space or switch id based on 2-column mapping file
fromtab | Convert 2-column sequence file to FASTA format
gaps | Print out a list of gap sizes within sequences
gc | Plot G+C content distribution
identical | Given 2 fasta files, find all exactly identical records
ids | Generate a list of headers
info | Run `sequence_info` on fasta files
ispcr | Reformat paired primers into isPcr query format
join | Concatenate a list of seqs and add gaps in between
longestorf | Find longest orf for CDS fasta
pair | Sort paired reads to .pairs, rest to .fragments
pairinplace | Starting from fragment.fasta, find if adjacent records can form pairs
pool | Pool a bunch of fastafiles together and add prefix
qual | Generate dummy .qual file based on FASTA file
random | Randomly take some records
sequin | Generate a gapped fasta file for sequin submission
simulate | Simulate random fasta file for testing
some | Include or exclude a list of records (also performs on .qual file if available)
sort | Sort the records by IDs, sizes, etc.
summary | Report the real no of bases and N's in fasta files
tidy | Normalize gap sizes and remove small components in fasta
translate | Translate CDS to proteins
trim | Given a cross_match screened fasta, trim the sequence
trimsplit | Split sequences at lower-cased letters
uniq | Remove records that are the same
Entonces necesitas usar una acción, solo puedes hacer:
python -m jcvi.formats.fasta extract
Esto le indicará las opciones y argumentos que espera.
Siéntase libre de consultar otros scripts en el paquete, no es solo para FASTA.