PubData
— это поисковая система и система поиска файлов для всех баз данных биоинформатики по всему миру. PubData
выполняет поиск биомедицинских данных FTP удобным для пользователя способом, аналогично тому, как PubMed ищет биомедицинскую литературу. PubData
размещается как веб-приложение и отдельная программа с графическим пользовательским интерфейсом (GUI), а PubMed размещается как онлайн-веб-сервер. PubData
построен на новых алгоритмах сетевого программирования и обработки естественного языка, которые могут подключаться к FTP-серверам любой указанной пользователем базы данных биоинформатики, запрашивать ее содержимое и извлекать файлы для загрузки.
PubData
написан на языке программирования Python (в частности, Django и PyQt4). PubData
может удаленно искать, получать доступ, просматривать и извлекать файлы из глубоко вложенных деревьев каталогов любой крупной базы данных биоинформатики через локальную компьютерную сеть. Собирая все основные базы данных биоинформатики под крышей одной программы, PubData
позволяет пользователю избежать ненужных хлопот и нестандартизированных сложностей, присущих доступу к базам данных одна за другой с помощью интернет-браузера. Что еще более важно, он позволяет пользователю одновременно запрашивать несколько баз данных по заданным пользователем ключевым словам (например, human
, cancer
, transcriptome
). Таким образом, PubData
позволяет исследователям искать, получать доступ, просматривать и загружать файлы с FTP-серверов любой крупной базы данных биоинформатики непосредственно из одного централизованного места. Используя только графический интерфейс или веб-приложение, PubData
позволяет пользователю одновременно просматривать несколько биоинформатических FTP-серверов непосредственно со своего локального компьютера.
Пожалуйста, цитируйте: «Хомчук и др.: «PubData: поисковая система для баз данных биоинформатики по всему миру», 2016: http://dx.doi.org/10.1101/069575» в любом источнике, в котором используются любые методы, вдохновленные PubData
.
PubData
. Когда вы открываете PubData
, сначала выберите базу данных биоинформатики для входа в систему:
Выполнен вход в базу данных системы классификации PANTHER (Анализ белков через эволюционные отношения):
Если вы не видите любимую базу данных в списке, вы можете вставить ее самостоятельно (удобно для недавно опубликованных баз):
Допустим, вы хотите выполнить поиск в Google по нескольким базам данных одновременно:
Поиск по ключевым словам файлов ChIP-seq в этих выбранных базах данных (также можно использовать несколько ключевых слов):
Показаны все релевантные результаты поиска, относящиеся к файлам ChIP-seq, во всех выбранных базах данных:
Поиск по ключевым словам файлов RNA-seq в этих выбранных базах данных (также можно использовать несколько ключевых слов):
Показаны все соответствующие результаты поиска, относящиеся к файлам RNA-seq (из выбранных баз данных):