spfy : 대장균 전체 게놈 서열에서 하위 유형을 예측하고 인구 전체 비교 분석을 위한 그래프 데이터를 구축하는 플랫폼입니다.
출판명: Le,KK, Whiteside,MD, Hopkins,JE, Gannon,VPJ, Laing,CR spfy : 박테리아 표현형의 실시간 예측 및 다운스트림 비교 분석을 위한 통합 그래프 데이터베이스. 데이터베이스(2018) Vol. 2018: 기사 ID bay086; doi:10.1093/데이터베이스/bay086
라이브: https://lfz.corefacility.ca/superphy/spfy/
git clone --recursive https://github.com/superphy/spfy.git
cd spfy /
docker-compose up
EC유형기:
팬프레딕:
Conda용 Docker 이미지:
다양한 인구 그룹 비교:
하위 유형 지정 모듈의 런타임:
cd app/
python -m modules/savvy -i tests/ecoli/GCA_001894495.1_ASM189449v1_genomic.fna
여기서 -i
뒤의 인수는 게놈(FASTA) 파일입니다. spfy 에 대한 온톨로지는 https://raw.githubusercontent.com/superphy/backend/master/app/scripts/spfy_ontology.ttl에서 사용할 수 있습니다. https://raw.githubusercontent.com/superphy/backend/master를 사용하여 생성되었습니다. /app/scripts/generate_ontology.py spfy 백엔드 코드의 공유 기능이 포함되어 있습니다. 이를 실행하려면 다음을 수행하십시오. 1. cd app/
2. python -m scripts/generate_ontology
그러면 온톨로지를 app/
에 넣을 것입니다.
http://www.visualdataweb.de/webvowl/을 사용하여 .ttl 파일에서 예쁜 다이어그램을 생성할 수 있습니다.
메모
현재 .fna 파일용으로만 설정되어 있습니다.
다음을 통해 프런트 엔드 웹 사이트를 우회하고 하위 입력 작업을 대기열에 추가할 수 있습니다.
/datastore
에 마운트합니다.예를 들어
/home/bob/ecoli-genomes/
에 파일을 보관하는 경우docker-compose.yml
파일을 편집하고 다음을 바꿉니다.volumes : - /datastore와 함께:
volumes : - /home/bob/ecoli-genomes:/datastore
docker-compose down docker-compose up -d
docker exec -it backend_webserver_1 sh python -m scripts/sideload exit
게놈 폴더에 잔여물이 생성될 수 있습니다.
도킹 이미지 | 포트 | 이름 s | 설명 |
---|---|---|---|
백엔드-rq | 80/tcp, 443/tcp | 백엔드_작업 ker_1 | 주요 Redi 대기열 작업자 |
백엔드- rq-b 지연 그래프 h | 80/tcp, 443/tcp | 백엔드_wor ker- blaz egra ph-i ds_ 1 | 이것은 blaz egra ph 데이터베이스에 대한 spfy ID 유전자 비율을 처리하는 것입니다. |
백엔드 | 0.0. 0.0: 8000 ->80 /tcp, 443/tcp | 백엔드_웹 -ngi nx-u wsgi _1 | 작업을 처리하는 Flas k 백엔드 |
슈퍼 rphy /bla zegr aph: 2.1. 4인치 페퍼 엔싱 | 0.0. 0.0: 8080 ->80 80/tcp | 백엔드_bla zegr aph_1 | Blaz egra ph 데이터베이스 |
레디 s:3. 2 | 6379 /TCP | 백엔드_빨간색은_1 | Redi의 데이터베이스 |
리액 탭 | 0.0. 0.0: 8090 ->50 00/tcp | 백엔드_rea ctap p_1 | 프론트 t-en d에서 spfy 로 |
superphy/backend-rq:2.0.0
이미지는 확장 가능합니다 . 처리 능력이 필요하거나 보유한 만큼 인스턴스를 생성할 수 있습니다. 이미지는 RGI
호출을 포함하여 대부분의 작업을 처리하는 multiples
대기열(12개 작업자)을 수신하는 역할을 담당합니다. 또한 ECTyper
실행하는 singles
큐(1 작업자)를 수신합니다. 이는 RGI
방정식에서 가장 느린 부분이기 때문에 수행됩니다. 작업자 관리는 supervisor
에서 처리됩니다.
superphy/backend-rq-blazegraph:2.0.0
이미지는 확장 가능하지 않습니다. Blazegraph 데이터베이스에서 중복 항목을 쿼리하고 spfy ID를 순차적 으로 할당하는 역할을 담당합니다. 성능 향상을 위해 기능을 가능한 한 최소화합니다(ID 생성은 병렬 파이프라인의 병목 현상 중 하나이므로). 비교는 제출된 파일의 sha1 해시에 의해 수행되며, 중복되지 않은 파일은 생성된 spfy ID를 파일 해시에 연결하여 ID를 예약합니다. 작업자 관리는 supervisor
에서 처리됩니다.
Flask 엔드포인트를 실행하는 superphy/backend:2.0.0
은 supervisor
사용하여 내부 프로세스( nginx
, uWsgi
를 관리합니다.
/app/config.py
의 database['blazegraph_url']
에서 엔드포인트를 적절하게 수정하세요. 새 모듈을 추가하는 데 필요한 단계는 개발자 가이드에 설명되어 있습니다.