Downcodes のエディターは、NCBI データベースの包括的な紹介を提供します。 NCBI (国立バイオテクノロジー情報センター) は、国立衛生研究所 (NIH) に所属するセンターであり、世界的な生物医学研究に大量のデータ リソースと強力な分析ツールを提供する多くの重要な生物医学データベースを維持しています。この記事では、NCBI の 8 つの主要なデータベース (GenBank、PubMed、BLAST、Protein、Nucleotide、Gene、OMIM、および GEO) を詳しく取り上げ、それぞれの機能とアプリケーションを詳しく紹介します。
NCBI には、GenBank、PubMed、BLAST、タンパク質、ヌクレオチド、遺伝子、OMIM、GEO などを含む複数のデータベースがあります。各データベースには独自の機能があり、それらが連携して生物医学研究に強力なサポートとデータ リソースを提供します。
GenBank データベースは、ユーザーがさまざまな生物の遺伝子配列データを検索、ダウンロード、分析できるようにする大規模な公開遺伝子配列データベースです。たとえば、研究者はここで特定の種の遺伝子配列を検索し、比較分析を実行し、さらには新しい配列データを提出することもできます。
1.ゲンバンク
GenBank データベースは世界最大の公開 DNA 配列データベースであり、国立衛生研究所 (NIH) の子会社である国立バイオテクノロジー情報センター (NCBI) によって維持されています。さまざまな生物から得られた大量の配列データが含まれており、日々新しいデータが追加されています。 GenBank の主な機能には、遺伝子配列情報の保存、検索、交換が含まれますが、これらに限定されません。さらに、GenBank は、ヨーロッパの EMBL や日本の DDBJ などの他の国際配列データベースと協力して、遺伝子配列データの世界的な共有を確保しています。
GenBankは、キーワード、種名、著者名などによる検索など、さまざまなタイプの配列検索をサポートしています。研究を促進するために、GenBank は研究者が新しい遺伝子配列を提出するためのオンライン提出ツールも提供しています。これらの提出物は、注釈と品質管理を通過した後、世界中の科学研究機関および個人に公開されます。
2. 公開済み
PubMed は、主に生物医学分野の雑誌文書を収集する無料の文献検索システムです。 PubMed の機能は非常に強力かつ多様です。従来の文献要約情報の検索だけでなく、全文リソースへの直接リンク、文献管理ツールの提供、さらには特別なデータ マイニング API サービスも備えています。たとえば、研究者は PubMed を使用して、特定の病気や特定の遺伝子に関する最新の研究結果を検索し、理論的および実験的なインスピレーションを得ることができます。
PubMed データベースのほとんどのレコードには、出版物の要約と参考情報へのクリック可能なリンクも含まれており、多くは無料の全文アクセス リンク (PMC の記事) を提供しています。さらに、PubMed の My NCBI 機能を使用すると、ユーザーは検索戦略をカスタマイズし、検索結果を保存し、電子メール アラートを作成できます。
3. ブラスト
BLAST は、特定の配列に非常に類似した配列を見つけることができる一般的な配列アラインメント ツールです。 BLASTデータベースには、GenBankなどから取得した大量の配列データが含まれており、塩基配列を比較するヌクレオチドBLASTやタンパク質の配列を比較するプロテインBLASTなど、さまざまなアライメントプログラムを提供しています。 BLAST の機能は、ユーザーが配列の起源と機能を特定し、遺伝的関係を推測し、配列間の相同性を特定するのに役立ちます。
BLAST の使用は非常に簡単です。研究者は配列を入力するだけで、BLAST は一連の類似配列と、ターゲット配列との類似性、一致する領域などの関連情報をすぐに返します。この情報は、新しい遺伝子の発見、遺伝子機能の研究、体系的な進化研究の実施にとって非常に重要です。
4. タンパク質
NCBI のタンパク質データベースは、タンパク質の配列と機能に焦点を当てたデータベースで、GenBank、RefSeq、TPA、PDB などのソースからタンパク質配列データを収集し、さまざまな検索および分析ツールを提供します。タンパク質データベースの特徴は、機能説明、構造情報、類似配列、文献引用などを含むがこれらに限定されない、タンパク質配列の詳細なアノテーション情報を提供することです。
タンパク質データベースは BLAST ツールとも緊密に統合されており、タンパク質配列のアラインメントと分析が可能です。研究者は多くの場合、この情報を使用してタンパク質の機能を予測したり、疾患との関連性を調査したり、生物工学用途向けにタンパク質を設計および操作したりします。
5. ヌクレオチド
ヌクレオチド データベースとは、具体的には、単一ヌクレオチド配列について NCBI によって維持されているデータベースを指します。ここには、DNA および RNA の配列記録が多数収集されており、検索インターフェースにより、さまざまな条件 (種、遺伝子名、配列 ID など) に従って情報を検索することができます。ヌクレオチド データベースは、バイオインフォマティクス分析、分子生物学研究、遺伝研究で広く使用されています。
ヌクレオチド データベースを通じて、研究者は特定の遺伝子配列情報に迅速にアクセスしてダウンロードし、その後の遺伝子クローニング、配列比較、変異解析、その他の作業を行うことができます。このデータベースの強みは、膨大な量の情報を提供し、リアルタイムで更新されることです。また、他の NCBI データベースともリンクされており、科学研究者にワンストップのヌクレオチド情報クエリ サービスを提供します。
6. 遺伝子
遺伝子データベースは、既知および予測遺伝子とその情報を保存するために特に使用されます。各遺伝子レコードには、配列、遺伝子発現、機能からエピジェネティックな修飾に至るまでの包括的な情報が含まれています。遺伝子データベースは、単一種の遺伝情報をユーザーに提供するだけでなく、異なる種の同じ遺伝子の記録をリンクして、比較ゲノミクス研究を容易にします。
遺伝子データベースの中核機能の 1 つは、遺伝子名、導入、発現パターン、関連疾患などを含む、遺伝子の詳細なアノテーション情報を提供することです。病気のメカニズムの研究や創薬ターゲットの発見に重要な遺伝子データベースを通じて、特定の遺伝子の研究内容を深く理解することができます。
7. オミム
OMIM (Online Mendelian Inheritance in Man) は、遺伝病と遺伝子のオンライン データベースです。ヒトの遺伝病やさまざまな遺伝子変異に関する詳細な情報が含まれています。 OMIM の目標は、すべての既知の遺伝病の表現型の説明と遺伝子型の詳細を抽出し、ヒトの遺伝病理学を研究するための重要なリソースになることです。
OMIM データベース内の情報には、通常、臨床的特徴、遺伝的パターン、疾患の分子基盤などが含まれます。 OMIM を通じて、研究者は関連する遺伝病に関する詳細なデータに迅速にアクセスでき、病気のメカニズム、遺伝カウンセリング、治療方法の研究に大いに役立ちます。
8. ジオ
GEO (Gene Expression Omnibus) は、ハイスループットの遺伝子発現データ、特にマイクロアレイおよび次世代シーケンス データを保存するデータベースです。 GEO は、学際的な研究分野から提出された実験データを受け入れ、これらのデータの照会およびダウンロード サービスを科学研究者に提供します。
GEO データベースのデータは、さまざまなサンプル間の遺伝子発現の違いの比較、遺伝子発現に対する特定の治療法の影響の分析など、さまざまな種類の生物医学研究に使用できます。このデータベースは、対応する分析ツールも提供し、研究者がオンラインで遺伝子発現パターンを分析および視覚化できるようにします。
一般に、NCBI は生物医学分野の多数のデータベース リソースをまとめ、研究者に強力なデータ サポートと研究ツールを提供します。各データベースは独自の機能を持ち、生物科学と医学研究の進歩に不可欠な役割を果たし、使用されています。
1. NCBI (National Center for Biotechnology Information) の主なデータベースは何ですか?これらのデータベースは何に使用されますか?
NCBI はライフサイエンスに関連する情報を提供する重要なリソースです。以下に主なデータベースとその機能を紹介します。
PubMed: これは生物医学文献データベースです。PubMed Central (PMC) サブデータベースを通じて、ユーザーは多くの高品質の生物医学文献を無料で入手できます。 GenBank: これは、生物学的配列情報を共有、検索、アクセスするためのグローバル プラットフォームを研究者に提供する DNA 配列情報を含むデータベースです。 GenBank には、数億のゲノム、遺伝子、タンパク質の配列情報が保存されています。 Sequence Read Archive (SRA): このデータベースには、DNA フラグメント シーケンシング、RNA シーケンシング、タンパク質シーケンシング、その他の情報を含む大量のハイスループット シーケンシング データが保存されており、研究者はここで研究者自身の研究に適したデータ セットを見つけることができます。 Protein Data Bank (PDB): タンパク質の構造情報を大量に蓄積したタンパク質の立体構造データベースです。研究者は、PDB を通じてタンパク質の構造データを取得し、タンパク質の構造と機能の関係を理解できます。 Gene Expression Omnibus (GEO): これは、大量のトランスクリプトームおよび発現プロファイル データを保存する遺伝子発現データベースです。研究者は GEO データベースを使用して、特定の生物学的プロセスや疾患に関連する遺伝子発現情報を見つけることができます。2. NCBI が提供するデータベースでは、どのようなタイプのゲノム データが NCBI によって収集されますか?これらのデータは研究にどのように使用されますか?
NCBI が取得したゲノム データには多くの種類が含まれており、主に次のカテゴリが含まれます。
ゲノム: 染色体およびミトコンドリア DNA 配列を含む、生物全体のゲノム配列。 EST (Expressed Sequence Tag): 配列決定法によって得られる cDNA 配列断片。遺伝子機能の研究に使用できます。 HTG (ハイ スループット ゲノム シーケンス): ハイ スループット シーケンシングによって生成される DNA 配列の短いフラグメント。ゲノム配列の開始フレームワークを構築するために使用されます。 GSS (Genome Survey Sequence): ゲノムの範囲を配列決定するために使用されるランダムな DNA フラグメント。 TSA (Transcriptome Shotgun Assembly): EST フラグメントを組み合わせてスプライシングすることによって得られるトランスクリプトームの全体配列。 WGS (Whole Genome Shotgun Sequence): 全ゲノムの配列決定とアノテーションに使用される、全ゲノムの無秩序な配列。これらのゲノムデータは、遺伝子機能研究、ゲノム比較・進化解析、創薬・疾患診断などの研究分野で広く活用されています。研究者はこれらのデータを使用して、遺伝子の構造、機能、制御機構を分析し、生物の遺伝的変異と進化の過程を明らかにし、特定の遺伝子と疾患の関連性を発見し、個別化医療のサポートを提供できます。
3. タンパク質の配列と構造の分析に使用できる NCBI データベースはどれですか?これらのデータベースは研究者がタンパク質研究を行うのにどのように役立ちますか?
NCBI は、タンパク質の配列と構造を分析するための複数のデータベースを提供しています。重要なデータベースの一部を以下に示します。
UniProt: これは、タンパク質の配列、構造、機能、相互作用に関する情報を提供する包括的なタンパク質データベースです。研究者は UniProt を使用して目的のタンパク質を見つけ、その基本的な特性と機能を理解できます。 Protein Data Bank (PDB): 結晶学によって決定されたタンパク質の立体構造データを大量に保管するデータベースです。研究者は、PDB の構造情報を使用して、タンパク質の立体構造、作用機序、および他の分子との相互作用を研究できます。 Conserved DomAIn Database (CDD): このデータベースは、既知のタンパク質配列内の保存された機能ドメインを収集し、ドメインの注釈と分類情報を提供します。研究者は CDD を使用してタンパク質の機能ドメインの組み合わせと構造的特徴を分析し、その機能と類似性を推測できます。構造機能連鎖データベース (SFLD): このデータベースは、タンパク質の配列、構造、機能の関係を統合し、詳細な注釈と分類情報を提供します。研究者はSFLDを使用してタンパク質の機能と構造の関係を調査し、タンパク質の機能と進化についての理解を深めることができます。これらのデータベースを通じて、研究者はタンパク質の配列や構造に関する大量の情報を取得し、配列比較、構造予測、機能アノテーション、類似性解析などの研究を行うことで、タンパク質の機能や制御機構を深く探求し、学術研究を提供することができます。関連分野のサポート。
Downcodes の編集者によるこの記事が、NCBI データベースと生物医学研究におけるその応用についての理解を深めるのに役立つことを願っています。 ご質問がございましたら、お気軽にお問い合わせください。