Sammlung von Python-Bibliotheken zum Parsen von Bioinformatikdateien oder zum Durchführen von Berechnungen im Zusammenhang mit Assemblierung, Annotation und vergleichender Genomik.
Autoren | Haibao Tang (Tanghaibao) |
Vivek Krishnakumar (vivekkrish) | |
Xingtan Zhang (tangerzhang) | |
Won Cheol Yim (wyim-pgl) | |
[email protected] | |
Lizenz | BSD |
Tipp
JCVI ist jetzt in iMeta veröffentlicht!
Tang et al. (2024) JCVI: Ein vielseitiges Toolkit für die vergleichende Genomanalyse. iMeta
Die folgenden Module stehen als generische Bioinformatik-Handhabungsmethoden zur Verfügung.
Algorithmen
Apps
Formate
Unterstützt derzeit .ace
Format (phrap, cap3 usw.), .agp
(Goldenpath), .bed
-Format, .blast
-Ausgabe, .btab
-Format, .coords
-Format ( nucmer
-Ausgabe), .fasta
-Format, .fastq
-Format, .fpc
Format, .gff
Format, obo
-Format (Ontologie), .psl
Format (UCSC Blat, GMAP usw.), .posmap
Format (Celera-Assembler-Ausgabe), .sam
Format (Lesezuordnung), .contig
-Format (TIGR-Assembly-Format) , usw.
Grafik
Dienstprogramme
Dann gibt es Module, die domänenspezifische Methoden enthalten.
Montage
Anmerkung
vergleichen
Bitte besuchen Sie Wiki für vollständige Anwendungen.
Im Folgenden finden Sie eine Liste von Python-Paketen von Drittanbietern, die von einigen Routinen in der Bibliothek verwendet werden. Diese Abhängigkeiten sind nicht zwingend, da sie nur von wenigen Modulen genutzt werden.
Es gibt hier und da weitere Python-Module in verschiedenen Skripten. Der beste Weg ist, sie über pip install
zu installieren, wenn ImportError
angezeigt wird.
Am einfachsten ist die Installation über PyPI:
pip install jcvi
So installieren Sie die Entwicklungsversion:
pip install git+git://github.com/tanghaibao/jcvi.git
Alternativ, wenn Sie manuell installieren möchten:
cd ~/code # or any directory of your choice
git clone git://github.com/tanghaibao/jcvi.git
pip install -e .
Darüber hinaus fragen einige Module möglicherweise nach Speicherorten externer Programme, wenn die Erweiterung nicht in Ihrem PATH
gefunden werden kann. Die häufig verwendeten externen Programme sind:
Die meisten Skripte in diesem Paket enthalten mehrere Aktionen. Um das fasta
-Beispiel zu verwenden:
Usage:
python -m jcvi.formats.fasta ACTION
Available ACTIONs:
clean | Remove irregular chars in FASTA seqs
diff | Check if two fasta records contain same information
extract | Given fasta file and seq id, retrieve the sequence in fasta format
fastq | Combine fasta and qual to create fastq file
filter | Filter the records by size
format | Trim accession id to the first space or switch id based on 2-column mapping file
fromtab | Convert 2-column sequence file to FASTA format
gaps | Print out a list of gap sizes within sequences
gc | Plot G+C content distribution
identical | Given 2 fasta files, find all exactly identical records
ids | Generate a list of headers
info | Run `sequence_info` on fasta files
ispcr | Reformat paired primers into isPcr query format
join | Concatenate a list of seqs and add gaps in between
longestorf | Find longest orf for CDS fasta
pair | Sort paired reads to .pairs, rest to .fragments
pairinplace | Starting from fragment.fasta, find if adjacent records can form pairs
pool | Pool a bunch of fastafiles together and add prefix
qual | Generate dummy .qual file based on FASTA file
random | Randomly take some records
sequin | Generate a gapped fasta file for sequin submission
simulate | Simulate random fasta file for testing
some | Include or exclude a list of records (also performs on .qual file if available)
sort | Sort the records by IDs, sizes, etc.
summary | Report the real no of bases and N's in fasta files
tidy | Normalize gap sizes and remove small components in fasta
translate | Translate CDS to proteins
trim | Given a cross_match screened fasta, trim the sequence
trimsplit | Split sequences at lower-cased letters
uniq | Remove records that are the same
Dann müssen Sie eine Aktion verwenden, Sie können einfach Folgendes tun:
python -m jcvi.formats.fasta extract
Dadurch erfahren Sie, welche Optionen und Argumente erwartet werden.
Schauen Sie sich gerne andere Skripte im Paket an, es gilt nicht nur für FASTA.