يقدم لك محرر Downcodes مقدمة شاملة لقاعدة بيانات NCBI. NCBI (المركز الوطني لمعلومات التكنولوجيا الحيوية) هو مركز تابع للمعاهد الوطنية للصحة (NIH) ويحتفظ بالعديد من قواعد البيانات الطبية الحيوية المهمة، والتي توفر موارد بيانات ضخمة وأدوات تحليل قوية للأبحاث الطبية الحيوية العالمية. ستلقي هذه المقالة نظرة متعمقة على قواعد البيانات الثمانية الرئيسية لـ NCBI: GenBank، وPubMed، وBLAST، وProtein، وNucleotide، وGene، وOMIM، وGEO، وستقدم وظائفها وتطبيقاتها بالتفصيل.
لدى NCBI قواعد بيانات متعددة، بما في ذلك GenBank وPubMed وBLAST وProtein وNucleotide وGene وOMIM وGEO وما إلى ذلك. تتمتع كل قاعدة بيانات بوظائفها الفريدة، والتي توفر معًا دعمًا قويًا وموارد بيانات للأبحاث الطبية الحيوية.
قاعدة بيانات GenBank هي قاعدة بيانات عامة كبيرة للتسلسل الجيني تتيح للمستخدمين البحث عن بيانات التسلسل الجيني لمختلف الكائنات الحية وتنزيلها وتحليلها. على سبيل المثال، يمكن للباحثين البحث عن التسلسل الجيني لنوع معين هنا، وإجراء تحليل مقارن، وحتى تقديم بيانات تسلسل جديدة.
1. بنك الجينات
قاعدة بيانات GenBank هي أكبر قاعدة بيانات عامة لتسلسل الحمض النووي في العالم، ويديرها المركز الوطني لمعلومات التكنولوجيا الحيوية (NCBI)، وهو فرع من المعاهد الوطنية للصحة (NIH). فهو يحتوي على كمية كبيرة من بيانات التسلسل التي تم الحصول عليها من مجموعة متنوعة من الكائنات الحية، ويتم إضافة بيانات جديدة كل يوم. تشمل الوظائف الرئيسية لبنك الجينات، على سبيل المثال لا الحصر، تخزين واسترجاع وتبادل معلومات التسلسل الجيني. بالإضافة إلى ذلك، يتعاون GenBank مع قواعد بيانات التسلسل الدولية الأخرى مثل EMBL في أوروبا وDDBJ في اليابان لضمان المشاركة العالمية لبيانات التسلسل الجيني.
يدعم GenBank أنواعًا مختلفة من عمليات البحث التسلسلية، مثل البحث حسب الكلمات الرئيسية وأسماء الأنواع وأسماء المؤلفين وما إلى ذلك. لتسهيل البحث، يوفر GenBank أيضًا أداة إرسال عبر الإنترنت للباحثين لتقديم تسلسلات جينية جديدة. سيتم نشر هذه التقديمات لمؤسسات البحث العلمي والأفراد في جميع أنحاء العالم بعد اجتياز الشرح ومراقبة الجودة.
2. ناشر
PubMed هو نظام مجاني لاسترجاع الأدبيات يجمع بشكل رئيسي وثائق المجلات في مجال الطب الحيوي. تعد وظائف PubMed قوية جدًا ومتنوعة. فهي لا تتضمن فقط استرجاع المعلومات المجردة من الأدبيات التقليدية، بل يمكنها أيضًا الارتباط مباشرة بموارد النص الكامل، وتوفير أدوات إدارة الأدبيات، وحتى الحصول على خدمات API خاصة لاستخراج البيانات. على سبيل المثال، يمكن للباحثين استخدام PubMed للبحث عن أحدث نتائج الأبحاث حول مرض معين أو جين معين للحصول على الإلهام النظري والتجريبي.
تحتوي معظم السجلات في قاعدة بيانات PubMed أيضًا على ملخصات للمنشورات وروابط قابلة للنقر للحصول على معلومات مرجعية، ويوفر العديد منها روابط مجانية للوصول إلى النص الكامل (مقالات في PMC). بالإضافة إلى ذلك، تتيح ميزة My NCBI في PubMed للمستخدمين تخصيص إستراتيجيات البحث، وحفظ نتائج البحث، وإنشاء تنبيهات عبر البريد الإلكتروني.
3. الانفجار
BLAST هي أداة محاذاة تسلسل عامة يمكنها العثور على تسلسلات مشابهة إلى حد كبير لتسلسل معين. تحتوي قاعدة بيانات بلاست على كمية كبيرة من بيانات التسلسل التي تم الحصول عليها من GenBank ومصادر أخرى، وتوفر مجموعة متنوعة من برامج المحاذاة، مثل نوكليوتيد بلاست لمقارنة تسلسل النيوكليوتيدات وبروتين بلاست لمقارنة تسلسل البروتين. تتمثل وظيفة BLAST في مساعدة المستخدمين على تحديد أصل التسلسلات ووظيفتها، واستنتاج العلاقات الجينية، وتحديد التماثل بين التسلسلات.
يعد استخدام BLAST أمرًا بسيطًا للغاية، إذ يحتاج الباحثون فقط إلى إدخال تسلسل، وسيقوم BLAST بإرجاع سلسلة من التسلسلات المماثلة والمعلومات ذات الصلة بسرعة، مثل التشابه مع التسلسل المستهدف والمناطق المطابقة وما إلى ذلك. هذه المعلومات مهمة للغاية لاكتشاف جينات جديدة، ودراسة وظائف الجينات، وإجراء دراسات التطور المنهجي.
4. البروتين
قاعدة بيانات البروتين الخاصة بـ NCBI هي قاعدة بيانات تركز على تسلسلات البروتين ووظائفها، وهي تجمع بيانات تسلسل البروتين من مصادر تشمل GenBank وRefSeq وTPA وPDB، وتوفر مجموعة متنوعة من أدوات البحث والتحليل. تتمثل خاصية قاعدة بيانات البروتين في توفير معلومات توضيحية تفصيلية لتسلسلات البروتين، بما في ذلك على سبيل المثال لا الحصر الوصف الوظيفي والمعلومات الهيكلية والتسلسلات المماثلة والاستشهادات الأدبية وما إلى ذلك.
تم أيضًا دمج قاعدة بيانات البروتين بشكل محكم مع أدوات BLAST، مما يسمح بمحاذاة تسلسل البروتين وتحليله. غالبًا ما يستخدم الباحثون هذه المعلومات للتنبؤ بوظيفة البروتين، واستكشاف ارتباطه بالمرض، أو تصميم وهندسة البروتينات لتطبيقات الهندسة الحيوية.
5. النوكليوتيدات
تشير قاعدة بيانات النوكليوتيدات على وجه التحديد إلى قاعدة البيانات التي يحتفظ بها NCBI لتسلسلات النوكليوتيدات الفردية. يتم هنا جمع عدد كبير من سجلات تسلسل DNA وRNA، وتسمح واجهة البحث للمستخدمين باسترداد المعلومات وفقًا لمجموعة متنوعة من الشروط (مثل الأنواع، واسم الجين، ومعرف التسلسل، وما إلى ذلك). تُستخدم قاعدة بيانات النوكليوتيدات على نطاق واسع في تحليل المعلوماتية الحيوية وأبحاث البيولوجيا الجزيئية والأبحاث الوراثية.
من خلال قاعدة بيانات النيوكليوتيدات، يمكن للباحثين الوصول بسرعة إلى معلومات تسلسل جيني محددة وتنزيلها، وإجراء استنساخ الجينات اللاحق ومقارنة التسلسل وتحليل التنوع وغيرها من الأعمال. تكمن قوة قاعدة البيانات هذه في أنها توفر كمية هائلة من المعلومات ويتم تحديثها في الوقت الفعلي، كما أنها مرتبطة بقواعد بيانات NCBI الأخرى لتزويد الباحثين العلميين بخدمة الاستعلام عن معلومات النوكليوتيدات وقفة واحدة.
6. الجينات
تُستخدم قاعدة بيانات الجينات خصيصًا لتخزين الجينات المعروفة والمتوقعة ومعلوماتها. يحتوي كل سجل جيني على معلومات شاملة بدءًا من التسلسل والتعبير الجيني والوظيفة وحتى التعديلات اللاجينية. لا توفر قاعدة بيانات الجينات للمستخدمين معلومات وراثية عن نوع واحد فحسب، بل تربط أيضًا سجلات نفس الجين في أنواع مختلفة لتسهيل أبحاث الجينوم المقارنة.
تتمثل إحدى الوظائف الأساسية لقاعدة بيانات الجينات في توفير معلومات توضيحية مفصلة للجينات، بما في ذلك اسم الجين والمقدمة ونمط التعبير والأمراض ذات الصلة وما إلى ذلك. يمكن للمستخدمين الحصول على فهم متعمق لمحتوى البحث لجينات معينة من خلال قاعدة بيانات الجينات، وهو أمر بالغ الأهمية لدراسة آليات المرض واكتشاف أهداف الأدوية.
7. أوميم
OMIM، الوراثة المندلية عبر الإنترنت في الإنسان، هي قاعدة بيانات على الإنترنت للأمراض والجينات الوراثية. أنه يحتوي على معلومات مفصلة عن الأمراض الوراثية البشرية والطفرات الجينية المختلفة. الهدف من OMIM هو استخلاص الأوصاف المظهرية والتفاصيل الوراثية لجميع الأمراض الوراثية المعروفة ويصبح مصدرًا مهمًا لدراسة علم الأمراض الوراثية البشرية.
تتضمن المعلومات الموجودة في قاعدة بيانات OMIM عادةً الخصائص السريرية والأنماط الجينية والأساس الجزيئي للمرض وما إلى ذلك. من خلال OMIM، يمكن للباحثين الوصول بسرعة إلى البيانات التفصيلية حول الأمراض الوراثية ذات الصلة، وهو ما يساعد بشكل كبير في البحث عن آليات المرض والاستشارة الوراثية وطرق العلاج.
8. الجغرافيا
GEO، Gene Expression Omnibus، هي قاعدة بيانات تخزن بيانات التعبير الجيني عالية الإنتاجية، وخاصة المصفوفة الدقيقة وبيانات التسلسل من الجيل التالي. يقبل GEO البيانات التجريبية المقدمة من مجالات بحثية متعددة التخصصات ويوفر خدمات الاستعلام والتنزيل لهذه البيانات للباحثين العلميين.
يمكن استخدام البيانات الموجودة في قاعدة بيانات GEO في العديد من أنواع الأبحاث الطبية الحيوية، مثل مقارنة اختلافات التعبير الجيني بين العينات المختلفة، وتحليل تأثير طريقة علاج معينة على التعبير الجيني، وما إلى ذلك. توفر قاعدة البيانات هذه أيضًا أدوات التحليل المقابلة، مما يسمح للباحثين بتحليل وتصور أنماط التعبير الجيني عبر الإنترنت.
بشكل عام، يجمع NCBI عددًا كبيرًا من موارد قواعد البيانات في مجال الطب الحيوي ويوفر للباحثين دعمًا قويًا للبيانات وأدوات البحث. ولكل قاعدة بيانات وظائفها واستخداماتها الفريدة وتلعب دورًا أساسيًا في تقدم العلوم البيولوجية والأبحاث الطبية.
1. ما هي قواعد البيانات الرئيسية في NCBI (المركز الوطني لمعلومات التكنولوجيا الحيوية)؟ ما هي قواعد البيانات المستخدمة ل؟
يعد NCBI موردًا مهمًا يوفر المعلومات ذات الصلة بعلوم الحياة وسيتم عرض قواعد البيانات الرئيسية التالية ووظائفها أدناه:
PubMed: هذه قاعدة بيانات للأدبيات الطبية الحيوية، من خلال قاعدة البيانات الفرعية PubMed Central (PMC)، يمكن للمستخدمين الحصول على العديد من المؤلفات الطبية الحيوية عالية الجودة مجانًا. بنك الجينات: عبارة عن قاعدة بيانات تحتوي على معلومات تسلسل الحمض النووي والتي توفر للباحثين منصة عالمية لمشاركة معلومات التسلسل البيولوجي والبحث فيها والوصول إليها. يخزن GenBank مئات الملايين من معلومات تسلسل الجينوم والجينات والبروتينات. أرشيف قراءة التسلسل (SRA): تخزن قاعدة البيانات هذه كمية كبيرة من بيانات التسلسل عالية الإنتاجية، بما في ذلك تسلسل أجزاء الحمض النووي، وتسلسل الحمض النووي الريبي (RNA)، وتسلسل البروتين وغيرها من المعلومات، حيث يمكن للباحثين العثور على مجموعات البيانات المناسبة لأبحاثهم الخاصة. بنك بيانات البروتين (PDB): عبارة عن قاعدة بيانات ثلاثية الأبعاد لبنية البروتين تقوم بتخزين كمية كبيرة من معلومات بنية البروتين. يمكن للباحثين الحصول على بيانات بنية البروتين من خلال PDB وفهم العلاقة بين بنية البروتين ووظيفته. Gene Expression Omnibus (GEO): هذه قاعدة بيانات للتعبير الجيني تقوم بتخزين كمية كبيرة من بيانات ملف تعريف النسخ والتعبير. يمكن للباحثين استخدام قواعد بيانات GEO للعثور على معلومات التعبير الجيني المتعلقة بعمليات أو أمراض بيولوجية محددة.2. في قاعدة البيانات المقدمة من NCBI، ما هي أنواع البيانات الجينومية التي يلتقطها NCBI؟ كيف يتم استخدام هذه البيانات في البحث؟
تتضمن بيانات الجينوم التي تم التقاطها بواسطة NCBI العديد من الأنواع، بما في ذلك الفئات التالية بشكل رئيسي:
الجينوم: تسلسل الجينوم للكائن الحي بأكمله، بما في ذلك تسلسل الحمض النووي الصبغي والميتوكوندريا. EST (علامة التسلسل المعبر عنها): أجزاء تسلسل [كدنا] يتم الحصول عليها من خلال طرق التسلسل، والتي يمكن استخدامها لدراسة وظائف الجينات. HTG (تسلسل الجينوم عالي الإنتاجية): جزء قصير من تسلسل الحمض النووي الناتج عن تسلسل عالي الإنتاجية، يستخدم لبناء إطار البداية لتسلسل الجينوم. GSS (تسلسل مسح الجينوم): أجزاء عشوائية من الحمض النووي تستخدم لتغطية تسلسل الجينوم. TSA (Transcriptome Shotgun Assembly): التسلسل العام للنسخة التي تم الحصول عليها من خلال الجمع بين أجزاء EST وربطها. WGS (تسلسل الجينوم الكامل): تسلسل الجينوم الكامل المضطرب، يستخدم لتسلسل الجينوم بأكمله وشرحه.تُستخدم هذه البيانات الجينومية على نطاق واسع في مجالات البحث، مثل أبحاث وظائف الجينات، ومقارنة الجينوم والتحليل التطوري، وتطوير الأدوية وتشخيص الأمراض، وما إلى ذلك. يمكن للباحثين استخدام هذه البيانات لتحليل بنية الجينات ووظيفتها وآلية تنظيمها، والكشف عن التنوع الجيني والعملية التطورية للكائنات الحية، والعثور على الارتباط بين جينات وأمراض معينة، وتقديم الدعم للطب الشخصي.
3. ما هي قواعد بيانات NCBI التي يمكن استخدامها لتحليل تسلسلات البروتين وبنيته؟ كيف تساعد قواعد البيانات هذه الباحثين على إجراء أبحاث البروتين؟
يوفر NCBI قواعد بيانات متعددة لتحليل تسلسلات البروتين وبنيته، وفيما يلي بعض قواعد البيانات المهمة:
UniProt: هذه قاعدة بيانات بروتينية شاملة توفر معلومات حول تسلسل البروتين وبنيته ووظيفته وتفاعله. يمكن للباحثين استخدام UniProt للعثور على البروتينات محل الاهتمام وفهم خصائصها ووظائفها الأساسية. بنك بيانات البروتين (PDB): تخزن قاعدة البيانات هذه كمية كبيرة من بيانات بنية البروتين ثلاثية الأبعاد التي يحددها علم البلورات. يمكن للباحثين استخدام المعلومات الهيكلية الموجودة في PDB لدراسة شكل البروتين وآلية عمله وتفاعلاته مع الجزيئات الأخرى. قاعدة بيانات DomAIIn المحفوظة (CDD): تجمع قاعدة البيانات هذه المجالات الوظيفية المحفوظة في تسلسلات البروتين المعروفة وتوفر معلومات توضيحية وتصنيفية للمجال. يمكن للباحثين استخدام CDD لتحليل مجموعات المجالات الوظيفية والميزات الهيكلية في البروتينات لاستنتاج وظائفها وأوجه التشابه بينها. قاعدة بيانات الارتباط بين الهيكل والوظيفة (SFLD): تدمج قاعدة البيانات هذه العلاقة بين تسلسل البروتين وبنيته ووظيفته وتوفر معلومات تفصيلية وتصنيفًا. يمكن للباحثين استخدام SFLD لاستكشاف العلاقة بين وظيفة البروتين وبنيته وتعميق فهمهم لوظيفة البروتين وتطوره.من خلال قواعد البيانات هذه، يمكن للباحثين الحصول على كمية كبيرة من معلومات تسلسل البروتين وبنيته، وإجراء مقارنة التسلسل، والتنبؤ بالبنية، والتعليق الوظيفي، وتحليل التشابه وغيرها من الدراسات، وذلك لاستكشاف وظيفة البروتينات وآلية تنظيمها بعمق وتقديم الأبحاث في مجالها. المجالات ذات الصلة.
آمل أن تساعدك هذه المقالة التي كتبها محرر Downcodes على فهم قاعدة بيانات NCBI وتطبيقها في أبحاث الطب الحيوي بشكل أفضل. إذا كان لديك أي أسئلة، فلا تتردد في طرحها!