Descargar jcvi - Descarga del código fuente jcvi

jcvi

Otro código fuente

Descargar

JCVI: un conjunto de herramientas versátil para el análisis genómico comparativo

Colección de bibliotecas de Python para analizar archivos bioinformáticos o realizar cálculos relacionados con el ensamblaje, la anotación y la genómica comparativa.


Autores	Haibao Tang (tanghaibao)
	Vivek Krishnakumar (vivekkrish)
	Xingtan Zhang (tangerzhang)
	Won Cheol Yim (wyim-pgl)
Correo electrónico	[email protected]
Licencia	BSD

como citar

Consejo

¡JCVI ya está publicado en iMeta!

Tang y cols. (2024) JCVI: un conjunto de herramientas versátil para el análisis genómico comparativo. iMeta

Contenido

Los siguientes módulos están disponibles como métodos genéricos de manejo de bioinformática.

algoritmos
- Solucionador de programación lineal con SCIP y GLPK.
- Supermapa: busque un conjunto de anclajes que no se superpongan en la salida BLAST o NUCMER.
- Subsecuencia creciente más larga o más pesada.
- Operaciones matriciales.
aplicaciones
- GenBank entrez accession, Phytozome, Ensembl y descargador de SRA.
- Calcule la tasa de sustitución (no)sinónima entre pares de genes.
- Construcción básica de árboles filogenéticos utilizando PHYLIP, PhyML o RAxML y visualización.
- Envoltorio para BLAST+, LASTZ, LAST, BWA, BOWTIE2, CLC, CDHIT, CAP3, etc.
formatos
Actualmente admite el formato .ace (phrap, cap3, etc.), .agp (goldenpath), formato .bed , salida .blast , formato .btab , formato .coords (salida nucmer ), formato .fasta , formato .fastq , .fpc formato, formato .gff , formato obo (ontología), formato .psl (UCSC blat, GMAP, etc.), formato .posmap (salida del ensamblador Celera), Formato .sam (leer mapeo), formato .contig (formato de ensamblaje TIGR), etc.
gráficos
- BLAST o diagrama de puntos sintético.
- Histograma usando R y ASCII art.
- Pintar regiones en un conjunto de cromosomas.
- Tramas de macrosíntesis y microsíntesis.
utiles
- El mero se puede utilizar como estructura de datos de conjunto inconexo.
- range contiene operaciones de rango comunes, como superposición y encadenamiento.
- Recetas diversas de libros de cocina, decoradores iteradores, utilidades de mesa.

Luego están los módulos que contienen métodos específicos de dominio.

asamblea
- Análisis de histograma K-mer.
- Preparación y validación de ruta de mosaico para ensamblajes basados en clones.
- Andamiaje a través de ALLMAPS, mapa óptico y mapa genético.
- Procedimientos de control de calidad previos y posteriores al montaje.
anotación
- Entrenamiento de predictores de genes ab initio .
- Calcular estadísticas de genes, exones e intrones.
- Envoltorio para PASA y EVM.
- Inicie múltiples procesos MAKER.
comparar
- Filtro BLAST basado en puntuación C.
- Escanee Synteny (de novo) y levante (busque anclajes cercanos).
- Reconstrucción del genoma ancestral mediante el método de Sankoff y PAR.
- Buscador de duplicados de genes ortólogos y en tándem.

Aplicaciones

Visite la wiki para ver aplicaciones completas.

Dependencias

A continuación se muestra una lista de paquetes de Python de terceros que utilizan algunas rutinas de la biblioteca. Estas dependencias no son obligatorias ya que solo las utilizan unos pocos módulos.

Biopitón
engordado
matplotlib

Hay otros módulos de Python aquí y allá en varios scripts. La mejor manera es instalarlos mediante pip install cuando vea ImportError .

Instalación

La forma más sencilla es instalarlo mediante PyPI:

 pip install jcvi

Para instalar la versión de desarrollo:

 pip install git+git://github.com/tanghaibao/jcvi.git

Alternativamente, si desea instalar manualmente:

 cd ~/code  # or any directory of your choice
git clone git://github.com/tanghaibao/jcvi.git
pip install -e .

Además, algunos módulos pueden solicitar ubicaciones de programas externos, si el extendido no se puede encontrar en su PATH . Los programas externos que se suelen utilizar son:

herramientas kent
HERRAMIENTAS
REALZAR

La mayoría de los scripts de este paquete contienen múltiples acciones. Para usar el ejemplo fasta :

 Usage:
    python -m jcvi.formats.fasta ACTION


Available ACTIONs:
          clean | Remove irregular chars in FASTA seqs
           diff | Check if two fasta records contain same information
        extract | Given fasta file and seq id, retrieve the sequence in fasta format
          fastq | Combine fasta and qual to create fastq file
         filter | Filter the records by size
         format | Trim accession id to the first space or switch id based on 2-column mapping file
        fromtab | Convert 2-column sequence file to FASTA format
           gaps | Print out a list of gap sizes within sequences
             gc | Plot G+C content distribution
      identical | Given 2 fasta files, find all exactly identical records
            ids | Generate a list of headers
           info | Run `sequence_info` on fasta files
          ispcr | Reformat paired primers into isPcr query format
           join | Concatenate a list of seqs and add gaps in between
     longestorf | Find longest orf for CDS fasta
           pair | Sort paired reads to .pairs, rest to .fragments
    pairinplace | Starting from fragment.fasta, find if adjacent records can form pairs
           pool | Pool a bunch of fastafiles together and add prefix
           qual | Generate dummy .qual file based on FASTA file
         random | Randomly take some records
         sequin | Generate a gapped fasta file for sequin submission
       simulate | Simulate random fasta file for testing
           some | Include or exclude a list of records (also performs on .qual file if available)
           sort | Sort the records by IDs, sizes, etc.
        summary | Report the real no of bases and N's in fasta files
           tidy | Normalize gap sizes and remove small components in fasta
      translate | Translate CDS to proteins
           trim | Given a cross_match screened fasta, trim the sequence
      trimsplit | Split sequences at lower-cased letters
           uniq | Remove records that are the same