jcvi 다운로드 - jcvi 소스 코드 다운로드

jcvi

기타 소스코드

다운로드

JCVI: 비교 유전체학 분석을 위한 다목적 툴킷

생물정보학 파일을 구문 분석하거나 어셈블리, 주석 및 비교 유전체학과 관련된 계산을 수행하기 위한 Python 라이브러리 모음입니다.


저자	하이바오 탕(tanghaibao)
	비벡 크리슈나쿠마르(vivekkrish)
	장싱탄(tangerzhang)
	임원철 (wyim-pgl)
이메일	[email protected]
특허	BSD

인용 방법

팁

JCVI가 이제 iMeta에 게시되었습니다!

Tanget al. (2024) JCVI: 비교 유전체학 분석을 위한 다목적 툴킷. 아이메타

내용물

다음 모듈은 일반적인 생물정보학 처리 방법으로 사용할 수 있습니다.

알고리즘
- SCIP 및 GLPK를 사용한 선형 프로그래밍 솔버입니다.
- 슈퍼맵: BLAST 또는 NUCMER 출력에서 겹치지 않는 앵커 세트를 찾습니다.
- 가장 길거나 가장 무거운 증가 부분 수열.
- 매트릭스 작업.
앱
- GenBank entrez 가입, Phytozome, Ensembl 및 SRA 다운로더.
- 유전자 쌍 사이의 (비)동의적 대체율을 계산합니다.
- PHYLIP, PhyML 또는 RAxML을 사용한 기본 계통발생수 구성 및 시각화.
- BLAST+, LASTZ, LAST, BWA, BOWTIE2, CLC, CDHIT, CAP3 등을 위한 래퍼
형식
현재 .ace 형식(phrap, cap3 등), .agp (goldenpath), .bed 형식, .blast 출력, .btab 형식, .coords 형식( nucmer 출력), .fasta 형식, .fastq 형식, .fpc 지원합니다. 형식, .gff 형식, obo 형식(온톨로지), .psl 형식(UCSC blat, GMAP 등), .posmap 형식(Celera 어셈블러 출력), .sam 형식(읽기 매핑), .contig 형식(TIGR 어셈블리 형식) 등
제도법
- BLAST 또는 신테니 도트 플롯.
- R 및 ASCII 아트를 사용한 히스토그램.
- 염색체 세트의 영역을 페인트합니다.
- Macro-synteny 및 Micro-synteny 플롯.
유틸리티
- 그룹화는 분리된 집합 데이터 구조로 사용될 수 있습니다.
- range에는 중첩 및 연결과 같은 일반적인 범위 작업이 포함됩니다.
- 기타 요리책 레시피, 반복자 데코레이터, 테이블 유틸리티.

그런 다음 도메인별 메서드를 포함하는 모듈이 있습니다.

집회
- K-mer 히스토그램 분석.
- 복제 기반 어셈블리의 타일링 경로 준비 및 검증.
- ALLMAPS, 광학지도, 유전자지도를 통한 비계.
- 조립 전 및 조립 후 QC 절차.
주석
- ab initio 유전자 예측인자의 훈련.
- 유전자, 엑손 및 인트론 통계를 계산합니다.
- PASA 및 EVM용 래퍼.
- 여러 MAKER 프로세스를 시작합니다.
비교하다
- C-점수 기반 BLAST 필터.
- Synteny 스캔(de-novo) 및 들어 올리기(가까운 앵커 찾기)
- Sankoff와 PAR 방법을 사용한 조상 게놈 재구성.
- Ortholog 및 Tandem 유전자 중복 검색기.

응용

본격적인 응용 프로그램을 보려면 Wiki를 방문하십시오.

종속성

다음은 라이브러리의 일부 루틴에서 사용되는 타사 Python 패키지 목록입니다. 이러한 종속성은 소수의 모듈에서만 사용되므로 필수는 아닙니다 .

바이오파이톤
멍청하다
matplotlib

다양한 스크립트에는 여기저기에 다른 Python 모듈이 있습니다. 가장 좋은 방법은 ImportError 표시될 때 pip install 통해 설치하는 것입니다.

설치

가장 쉬운 방법은 PyPI를 통해 설치하는 것입니다.

 pip install jcvi

개발 버전을 설치하려면:

 pip install git+git://github.com/tanghaibao/jcvi.git

또는 수동으로 설치하려는 경우:

 cd ~/code  # or any directory of your choice
git clone git://github.com/tanghaibao/jcvi.git
pip install -e .

또한 PATH 에서 확장 프로그램을 찾을 수 없는 경우 일부 모듈에서는 외부 프로그램의 위치를 요청할 수 있습니다. 자주 사용되는 외부 프로그램은 다음과 같습니다.

켄트 도구
침대 도구
엠보싱

이 패키지에 있는 대부분의 스크립트에는 여러 작업이 포함되어 있습니다. fasta 예제를 사용하려면:

 Usage:
    python -m jcvi.formats.fasta ACTION


Available ACTIONs:
          clean | Remove irregular chars in FASTA seqs
           diff | Check if two fasta records contain same information
        extract | Given fasta file and seq id, retrieve the sequence in fasta format
          fastq | Combine fasta and qual to create fastq file
         filter | Filter the records by size
         format | Trim accession id to the first space or switch id based on 2-column mapping file
        fromtab | Convert 2-column sequence file to FASTA format
           gaps | Print out a list of gap sizes within sequences
             gc | Plot G+C content distribution
      identical | Given 2 fasta files, find all exactly identical records
            ids | Generate a list of headers
           info | Run `sequence_info` on fasta files
          ispcr | Reformat paired primers into isPcr query format
           join | Concatenate a list of seqs and add gaps in between
     longestorf | Find longest orf for CDS fasta
           pair | Sort paired reads to .pairs, rest to .fragments
    pairinplace | Starting from fragment.fasta, find if adjacent records can form pairs
           pool | Pool a bunch of fastafiles together and add prefix
           qual | Generate dummy .qual file based on FASTA file
         random | Randomly take some records
         sequin | Generate a gapped fasta file for sequin submission
       simulate | Simulate random fasta file for testing
           some | Include or exclude a list of records (also performs on .qual file if available)
           sort | Sort the records by IDs, sizes, etc.
        summary | Report the real no of bases and N's in fasta files
           tidy | Normalize gap sizes and remove small components in fasta
      translate | Translate CDS to proteins
           trim | Given a cross_match screened fasta, trim the sequence
      trimsplit | Split sequences at lower-cased letters
           uniq | Remove records that are the same