spfy :用于从大肠杆菌全基因组序列预测亚型的平台,并为全人群比较分析构建图形数据。
发布为:Le,KK, Whiteside,MD, Hopkins,JE, Gannon,VPJ, Laing,CR spfy :用于实时预测细菌表型和下游比较分析的集成图形数据库。数据库(2018)卷。 2018:文章ID bay086; doi:10.1093/数据库/bay086
直播:https://lfz.corefacility.ca/superphy/spfy/
git clone --recursive https://github.com/superphy/spfy.git
cd spfy /
docker-compose up
EC打字机:
泛预测:
Conda 的 Docker 镜像:
比较不同人群:
子类型化模块的运行时:
cd app/
python -m modules/savvy -i tests/ecoli/GCA_001894495.1_ASM189449v1_genomic.fna
其中-i
之后的参数是您的基因组 (FASTA) 文件。 spfy的本体位于: https://raw.githubusercontent.com/superphy/backend/master/app/scripts/spfy_ontology.ttl 它是使用 https://raw.githubusercontent.com/superphy/backend/master 生成的/app/scripts/generate_ontology.py 具有来自spfy后端代码的共享函数。如果您想运行它,请执行以下操作: 1. cd app/
2. python -m scripts/generate_ontology
这会将本体放在app/
中
您可以使用 http://www.visualdataweb.de/webvowl/ 从 .ttl 文件生成漂亮的图表
笔记
当前仅设置为 .fna 文件
您可以绕过前端网站并仍然通过以下方式对子类型作业进行排队:
/datastore
。例如,如果您将文件保存在
/home/bob/ecoli-genomes/
,则需要编辑docker-compose.yml
文件并替换:volumes : - /datastore和:
volumes : - /home/bob/ecoli-genomes:/datastore
docker-compose down docker-compose up -d
docker exec -it backend_webserver_1 sh python -m scripts/sideload exit
请注意,您的基因组文件夹中可能会创建残留物。
Docker镜像 | 端口 | 姓名 | 描述 |
---|---|---|---|
后端-rq | 80/t cp,443/tcp | 后端_worker_1 | 主要的Redi队列工作者 |
后端 - rq-b laze 图 h | 80/t cp,443/tcp | back end_work ker-blaz egra ph-i ds_ 1 | 此手 les spfy ID 基因比率为 blaz egra ph 数据库 |
后端 | 0.0。 0.0: 8000 ->80 /tcp , 443/tcp | back end_web -ngi nx -u wsgi _1 | 处理排队任务的 Flask 后端 |
超级 rphy /bla zegr aph:2.1。 4-推理 | 0.0。 0.0: 8080 ->80 80/吨cp | 后端_bla zegr aph_1 | Blaz egraph 数据库 |
雷迪:3。 2 | 6379/tcp | 后端_红色是_ 1 | Redis的数据库 |
反应塔普 | 0.0。 0.0: 8090 ->50 00/吨cp | 后端_rea ctap p_1 | 前端到spfy |
superphy/backend-rq:2.0.0
镜像是可扩展的:您可以根据需要/拥有处理能力创建任意数量的实例。该图像负责侦听multiples
队列(12 个工作线程),该队列处理大部分任务,包括RGI
调用。它还监听运行ECTyper
singles
队列(1 个工作线程)。这样做是因为RGI
是方程中最慢的部分。工人管理由supervisor
处理。
superphy/backend-rq-blazegraph:2.0.0
镜像不可扩展:它负责查询 Blazegraph 数据库中的重复条目并按顺序分配spfy ID。它的功能尽可能保持最少,以提高性能(因为 ID 生成是并行管道中的一个瓶颈);比较是通过提交文件的 sha1 哈希来完成的,非重复文件通过将生成的spfy ID 链接到文件哈希来保留其 ID。工人管理由supervisor
处理。
运行 Flask 端点superphy/backend:2.0.0
使用supervisor
来管理内部进程: nginx
、 uWsgi
。
/app/config.py
中的database['blazegraph_url']
下相应修改端点添加新模块所需的步骤记录在开发人员指南中。