PubData
هو محرك بحث ونظام لاسترجاع الملفات لجميع قواعد بيانات المعلوماتية الحيوية في جميع أنحاء العالم. تبحث PubData
في بيانات FTP الطبية الحيوية بطريقة سهلة الاستخدام تشبه الطريقة التي يبحث بها PubMed في الأدبيات الطبية الحيوية. تتم استضافة PubData
كتطبيق ويب وبرنامج برمجي مستقل لواجهة المستخدم الرسومية (GUI)، بينما تتم استضافة PubMed كخادم ويب عبر الإنترنت. تم بناء PubData
على برمجة شبكات جديدة وخوارزميات معالجة اللغة الطبيعية التي يمكنها التصحيح في خوادم FTP لأي قاعدة بيانات معلوماتية حيوية محددة من قبل المستخدم، والاستعلام عن محتوياتها، واسترداد الملفات للتنزيل.
تتم كتابة PubData
بلغة البرمجة Python (على وجه التحديد، Django وPyQt4). يمكن PubData
البحث عن الملفات والوصول إليها وعرضها واستردادها عن بعد من أشجار الدليل المتداخلة بشدة لأي قاعدة بيانات معلوماتية حيوية رئيسية عبر شبكة كمبيوتر محلية. من خلال تجميع جميع قواعد بيانات المعلوماتية الحيوية الرئيسية تحت سقف برنامج حاسوبي واحد، تسمح PubData
للمستخدم بتجنب المتاعب غير الضرورية والتعقيدات غير المعيارية المتأصلة في الوصول إلى قواعد البيانات واحدة تلو الأخرى باستخدام متصفح الإنترنت. والأهم من ذلك، أنه يسمح للمستخدم بالاستعلام عن قواعد بيانات متعددة في وقت واحد للكلمات الرئيسية المحددة من قبل المستخدم (على سبيل المثال، human
، cancer
، transcriptome
). على هذا النحو، تسمح PubData
للباحثين بالبحث عن الملفات والوصول إليها وعرضها وتنزيلها من خوادم FTP لأي قاعدة بيانات معلوماتية حيوية رئيسية مباشرة من موقع مركزي واحد. باستخدام واجهة المستخدم الرسومية أو تطبيق الويب فقط، تسمح PubData
للمستخدم بتصفح العديد من خوادم FTP للمعلومات الحيوية في وقت واحد مباشرةً من جهاز الكمبيوتر المحلي الخاص به.
يرجى الاستشهاد بما يلي: "Khomtchouk et al.: 'PubData: محرك بحث لقواعد بيانات المعلوماتية الحيوية في جميع أنحاء العالم'، 2016: http://dx.doi.org/10.1101/069575" ضمن أي مصدر يستخدم أي طرق مستوحاة من PubData
.
PubData
. عند فتح PubData
، اختر أولاً قاعدة بيانات المعلوماتية الحيوية لتسجيل الدخول إليها:
تم تسجيل الدخول إلى قاعدة بيانات نظام تصنيف PANTHER (تحليل البروتين من خلال العلاقات التطورية):
إذا كنت لا ترى قاعدة البيانات المفضلة لديك في القائمة، فيمكنك إدراجها يدويًا بنفسك (مناسبة لقواعد البيانات المنشورة مؤخرًا):
لنفترض أنك تريد "بحث Google" في قواعد بيانات متعددة في وقت واحد:
البحث عن الكلمات الرئيسية لملفات ChIP-seq عبر قواعد البيانات المحددة هذه (يمكن استخدام كلمات رئيسية متعددة أيضًا):
عرض جميع نتائج البحث ذات الصلة المتعلقة بملفات ChIP-seq عبر جميع قواعد البيانات المحددة:
البحث عن الكلمات الرئيسية لملفات RNA-seq عبر قواعد البيانات المحددة هذه (يمكن استخدام كلمات رئيسية متعددة أيضًا):
عرض جميع نتائج البحث ذات الصلة المتعلقة بملفات RNA-seq (من قواعد البيانات المحددة):