생물정보학 파일을 구문 분석하거나 어셈블리, 주석 및 비교 유전체학과 관련된 계산을 수행하기 위한 Python 라이브러리 모음입니다.
저자 | 하이바오 탕(탕하이바오) |
비벡 크리슈나쿠마르(vivekkrish) | |
장싱탄(tangerzhang) | |
임원철 (wyim-pgl) | |
이메일 | [email protected] |
특허 | BSD |
팁
JCVI가 이제 iMeta에 게시되었습니다!
Tanget al. (2024) JCVI: 비교 유전체학 분석을 위한 다목적 툴킷. 아이메타
다음 모듈은 일반적인 생물정보학 처리 방법으로 사용할 수 있습니다.
알고리즘
앱
형식
현재 .ace
형식(phrap, cap3 등), .agp
(goldenpath), .bed
형식, .blast
출력, .btab
형식, .coords
형식( nucmer
출력), .fasta
형식, .fastq
형식, .fpc
지원합니다. 형식, .gff
형식, obo
형식(온톨로지), .psl
형식(UCSC blat, GMAP 등), .posmap
형식(Celera 어셈블러 출력), .sam
형식(읽기 매핑), .contig
형식(TIGR 어셈블리 형식) 등
제도법
유틸리티
그런 다음 도메인별 메서드를 포함하는 모듈이 있습니다.
집회
주석
비교하다
본격적인 응용 프로그램을 보려면 Wiki를 방문하십시오.
다음은 라이브러리의 일부 루틴에서 사용되는 타사 Python 패키지 목록입니다. 이러한 종속성은 소수의 모듈에서만 사용되므로 필수는 아닙니다 .
다양한 스크립트에는 여기저기에 다른 Python 모듈이 있습니다. 가장 좋은 방법은 ImportError
표시될 때 pip install
통해 설치하는 것입니다.
가장 쉬운 방법은 PyPI를 통해 설치하는 것입니다.
pip install jcvi
개발 버전을 설치하려면:
pip install git+git://github.com/tanghaibao/jcvi.git
또는 수동으로 설치하려는 경우:
cd ~/code # or any directory of your choice
git clone git://github.com/tanghaibao/jcvi.git
pip install -e .
또한 PATH
에서 확장 프로그램을 찾을 수 없는 경우 일부 모듈에서는 외부 프로그램의 위치를 요청할 수 있습니다. 자주 사용되는 외부 프로그램은 다음과 같습니다.
이 패키지에 있는 대부분의 스크립트에는 여러 작업이 포함되어 있습니다. fasta
예제를 사용하려면:
Usage:
python -m jcvi.formats.fasta ACTION
Available ACTIONs:
clean | Remove irregular chars in FASTA seqs
diff | Check if two fasta records contain same information
extract | Given fasta file and seq id, retrieve the sequence in fasta format
fastq | Combine fasta and qual to create fastq file
filter | Filter the records by size
format | Trim accession id to the first space or switch id based on 2-column mapping file
fromtab | Convert 2-column sequence file to FASTA format
gaps | Print out a list of gap sizes within sequences
gc | Plot G+C content distribution
identical | Given 2 fasta files, find all exactly identical records
ids | Generate a list of headers
info | Run `sequence_info` on fasta files
ispcr | Reformat paired primers into isPcr query format
join | Concatenate a list of seqs and add gaps in between
longestorf | Find longest orf for CDS fasta
pair | Sort paired reads to .pairs, rest to .fragments
pairinplace | Starting from fragment.fasta, find if adjacent records can form pairs
pool | Pool a bunch of fastafiles together and add prefix
qual | Generate dummy .qual file based on FASTA file
random | Randomly take some records
sequin | Generate a gapped fasta file for sequin submission
simulate | Simulate random fasta file for testing
some | Include or exclude a list of records (also performs on .qual file if available)
sort | Sort the records by IDs, sizes, etc.
summary | Report the real no of bases and N's in fasta files
tidy | Normalize gap sizes and remove small components in fasta
translate | Translate CDS to proteins
trim | Given a cross_match screened fasta, trim the sequence
trimsplit | Split sequences at lower-cased letters
uniq | Remove records that are the same
그런 다음 하나의 작업을 사용해야 합니다. 다음을 수행하면 됩니다.
python -m jcvi.formats.fasta extract
이는 예상되는 옵션과 인수를 알려줍니다.
패키지에 있는 다른 스크립트도 자유롭게 확인해 보세요. 이는 단지 FASTA만을 위한 것이 아닙니다.