PubData
est un moteur de recherche et un système de récupération de fichiers pour toutes les bases de données bioinformatiques du monde entier. PubData
recherche les données FTP biomédicales d'une manière conviviale, similaire à la façon dont PubMed recherche la littérature biomédicale. PubData
est hébergé à la fois en tant qu'application Web et en tant que logiciel d'interface utilisateur graphique (GUI) autonome, tandis que PubMed est hébergé en tant que serveur Web en ligne. PubData
repose sur de nouveaux algorithmes de programmation réseau et de traitement du langage naturel qui peuvent se connecter aux serveurs FTP de n'importe quelle base de données bioinformatique spécifiée par l'utilisateur, interroger son contenu et récupérer des fichiers à télécharger.
PubData
est écrit dans le langage de programmation Python (en particulier Django et PyQt4). PubData
peut rechercher, accéder, visualiser et récupérer à distance des fichiers à partir des arborescences de répertoires profondément imbriquées de n'importe quelle base de données bioinformatique majeure via un réseau informatique local. En rassemblant toutes les principales bases de données bioinformatiques sous le toit d'un seul logiciel, PubData
permet à l'utilisateur d'éviter les tracas inutiles et les complexités non standardisées inhérentes à l'accès aux bases de données une par une à l'aide d'un navigateur Internet. Plus important encore, il permet à un utilisateur d'interroger simultanément plusieurs bases de données pour des mots-clés spécifiés par l'utilisateur (par exemple, human
, cancer
, transcriptome
). En tant que tel, PubData
permet aux chercheurs de rechercher, d'accéder, de visualiser et de télécharger des fichiers à partir des serveurs FTP de n'importe quelle base de données bioinformatique majeure directement à partir d'un emplacement centralisé. En utilisant uniquement une interface graphique ou une application Web, PubData
permet à l'utilisateur de surfer simultanément sur plusieurs serveurs FTP bioinformatiques directement depuis le confort de son ordinateur local.
Veuillez citer : "Khomtchouk et al. : 'PubData : moteur de recherche pour les bases de données bioinformatiques dans le monde entier', 2016 : http://dx.doi.org/10.1101/069575" dans toute source utilisant des méthodes inspirées de PubData
.
PubData
. Lorsque vous ouvrez PubData
, choisissez d'abord une base de données bioinformatique à laquelle vous connecter :
Connecté à la base de données du système de classification PANTHER (Protein ANalysis THrough Evolutionary Relations) :
Si vous ne voyez pas votre base de données préférée dans la liste, vous pouvez l'insérer manuellement vous-même (pratique pour les bases de données récemment publiées) :
Supposons que vous souhaitiez effectuer une « recherche Google » dans plusieurs bases de données simultanément :
Recherche par mot-clé pour les fichiers ChIP-seq dans ces bases de données sélectionnées (plusieurs mots-clés peuvent également être utilisés) :
Affichage de tous les résultats de recherche pertinents concernant les fichiers ChIP-seq dans toutes les bases de données sélectionnées :
Recherche par mot-clé pour les fichiers RNA-seq dans ces bases de données sélectionnées (plusieurs mots-clés peuvent également être utilisés) :
Affichage de tous les résultats de recherche pertinents concernant les fichiers RNA-seq (à partir des bases de données sélectionnées) :