Коллекция библиотек Python для анализа файлов биоинформатики или выполнения вычислений, связанных со сборкой, аннотацией и сравнительной геномикой.
Авторы | Хайбао Тан (Tanghaibao) |
Вивек Кришнакумар (вивеккриш) | |
Синтань Чжан (Тангерчжан) | |
Вон Чхоль Йим (wyim-pgl) | |
Электронная почта | [email protected] |
Лицензия | БСД |
Кончик
JCVI теперь опубликован в iMeta!
Тан и др. (2024) JCVI: универсальный набор инструментов для сравнительного геномного анализа. iMeta
Следующие модули доступны в качестве общих методов работы с биоинформатикой.
алгоритмы
приложения
форматы
В настоящее время поддерживается формат .ace
(phrap, cap3 и т. д.), .agp
(goldenpath), формат .bed
, вывод .blast
, формат .btab
, формат .coords
(вывод nucmer
), формат .fasta
, формат .fastq
, .fpc
формат, формат .gff
, формат obo
(онтология), формат .psl
(UCSC blat, GMAP и т. д.), формат .posmap
(ассемблер Celera вывод), формат .sam
(сопоставление чтения), формат .contig
(формат сборки TIGR) и т. д.
графика
утилиты
Кроме того, есть модули, содержащие методы, специфичные для предметной области.
сборка
аннотация
сравнивать
Пожалуйста, посетите вики для полноценных приложений.
Ниже приведен список сторонних пакетов Python, которые используются некоторыми подпрограммами библиотеки. Эти зависимости не являются обязательными, поскольку они используются только несколькими модулями.
Здесь и там в различных скриптах есть и другие модули Python. Лучший способ — установить их через pip install
когда вы увидите ImportError
.
Самый простой способ — установить его через PyPI:
pip install jcvi
Чтобы установить версию для разработки:
pip install git+git://github.com/tanghaibao/jcvi.git
Альтернативно, если вы хотите установить вручную:
cd ~/code # or any directory of your choice
git clone git://github.com/tanghaibao/jcvi.git
pip install -e .
Кроме того, некоторые модули могут запрашивать расположение внешних программ, если расширенная версия не может быть найдена в вашем PATH
. Часто используются внешние программы:
Большинство скриптов в этом пакете содержат несколько действий. Чтобы использовать пример fasta
:
Usage:
python -m jcvi.formats.fasta ACTION
Available ACTIONs:
clean | Remove irregular chars in FASTA seqs
diff | Check if two fasta records contain same information
extract | Given fasta file and seq id, retrieve the sequence in fasta format
fastq | Combine fasta and qual to create fastq file
filter | Filter the records by size
format | Trim accession id to the first space or switch id based on 2-column mapping file
fromtab | Convert 2-column sequence file to FASTA format
gaps | Print out a list of gap sizes within sequences
gc | Plot G+C content distribution
identical | Given 2 fasta files, find all exactly identical records
ids | Generate a list of headers
info | Run `sequence_info` on fasta files
ispcr | Reformat paired primers into isPcr query format
join | Concatenate a list of seqs and add gaps in between
longestorf | Find longest orf for CDS fasta
pair | Sort paired reads to .pairs, rest to .fragments
pairinplace | Starting from fragment.fasta, find if adjacent records can form pairs
pool | Pool a bunch of fastafiles together and add prefix
qual | Generate dummy .qual file based on FASTA file
random | Randomly take some records
sequin | Generate a gapped fasta file for sequin submission
simulate | Simulate random fasta file for testing
some | Include or exclude a list of records (also performs on .qual file if available)
sort | Sort the records by IDs, sizes, etc.
summary | Report the real no of bases and N's in fasta files
tidy | Normalize gap sizes and remove small components in fasta
translate | Translate CDS to proteins
trim | Given a cross_match screened fasta, trim the sequence
trimsplit | Split sequences at lower-cased letters
uniq | Remove records that are the same
Тогда вам нужно использовать одно действие, вы можете просто сделать:
python -m jcvi.formats.fasta extract
Он сообщит вам ожидаемые варианты и аргументы.
Не стесняйтесь проверить другие скрипты в пакете, это не только для FASTA.