PubData
是全球所有生物資訊資料庫的搜尋引擎和文件檢索系統。 PubData
以使用者友善的方式搜尋生物醫學 FTP 數據,類似於 PubMed 搜尋生物醫學文獻的方式。 PubData
以 Web 應用程式和獨立圖形使用者介面 (GUI) 軟體程式的形式託管,而 PubMed 以線上 Web 伺服器的形式託管。 PubData
基於新穎的網路程式設計和自然語言處理演算法構建,可以修補任何使用者指定的生物資訊資料庫的 FTP 伺服器、查詢其內容並檢索檔案以供下載。
PubData
是用 Python 程式語言(特別是 Django 和 PyQt4)寫的。 PubData
可以透過本機電腦網路從任何主要生物資訊資料庫的深層嵌套目錄樹中遠端搜尋、存取、檢視和擷取檔案。透過將所有主要生物資訊資料庫集中在一個軟體程式下, PubData
使用戶可以避免使用網路瀏覽器逐一存取資料庫所固有的不必要的麻煩和非標準化的複雜性。更重要的是,它允許使用者同時查詢多個資料庫以尋找使用者指定的關鍵字(例如, human
、 cancer
、 transcriptome
)。因此, PubData
允許研究人員直接從一個集中位置搜尋、存取、檢視和下載任何主要生物資訊資料庫的 FTP 伺服器上的檔案。透過僅使用 GUI 或 Web 應用程序, PubData
允許使用者直接從舒適的本機電腦同時瀏覽多個生物資訊學 FTP 伺服器。
請在使用受PubData
啟發的任何方法的任何來源中引用:“Khomtchouk 等人:‘PubData:全球生物資訊學資料庫搜尋引擎’,2016:http://dx.doi.org/10.1101/069575”。
PubData
目錄。當您開啟PubData
時,首先選擇要登入的生物資訊資料庫:
登入 PANTHER(透過演化關係進行蛋白質分析)分類系統資料庫:
如果清單中沒有看到您喜歡的資料庫,您可以自行手動插入(對於最近發布的資料庫很方便):
假設您想同時「Google 搜尋」多個資料庫:
在這些選定的資料庫中對 ChIP-seq 檔案進行關鍵字搜尋(也可以使用多個關鍵字):
顯示所有選定資料庫中與 ChIP-seq 檔案相關的所有相關搜尋結果:
在這些選定的資料庫中對 RNA-seq 檔案進行關鍵字搜尋(也可以使用多個關鍵字):
顯示與 RNA-seq 檔案相關的所有相關搜尋結果(來自所選資料庫):