[ English ]

4.12 PCDq - タンパク質間-複合体間相互作用統合データベース

4.12.1 PCDq概要

PCDqは、H-InvDBにおけるヒ トタンパク質複合体、それらの相互作用、またヒトタンパク質間相互作用情報 のデータベースです。多くの細胞内プロセスはタンパク質が複合体あるいは機 能単位を構成して行われています。よって、タンパク質の機能を理解するため には、 タンパク質を複合体/機能単位ごとに考察していくことが重要です。

PCDqの構築にあたり、まずタンパク質間相互作用データについては BIND, DIP, MINT, HPRD, IntAct, および GNP_Y2H の6つのデータベースから取得し、統合した タンパク質とタンパク質間相互作用データセットを作成しました (2007年11月)。 これらから形成されるPPIネットワークから、タンパク質複合体/機能単位の予測を行いました。 そのすべての予測結果について、人手による既知の複合体情報との照合、情報を付加・修正を行いました。

PCDqは、PPIの情報(PPI view)、タンパク質複合体・タンパク質複合体間相互作用情報(Protein complex view)、および描画ツール(PPI-Map) の3つの画面によって、タンパク質間-複合体間相互作用の情報を提供するデータベースです。


Fig 4.12.1 PPI view概要

4.12.2 PPCDqへのアクセス

http://h-invitational.jp/hinv/pcdq/ からアクセスしてください。


4.12.3 PCDqのデータ

HIP: H-Invitational Protein
H-InvDBの転写物データから独自予測されたタンパク質。 タンパク質のアミノ酸配列それぞれにHIP IDを付与しています。
※タンパク質のアミノ酸配列が一残基でも異なる場合は異なるHIP IDを持っています。

PCDqにおける同一タンパク質の定義
H-InvDBの全タンパク質について同一相同性によるクラスタリングを行って、 95%以上の領域において、98%以上の相同性を持つタンパク質同士を同一のタンパク質として定義しています。

タンパク質間相互作用データ
主要なタンパク質間相互作用リソースとして、 BIND, DIP, MINT, HPRD, IntAct, GNP_Y2H の6つのデータベースを選択しデータの収集・統合を行いました。


Fig 4.12.2 各PPIデータベースの統計

タンパク質配列の同一相同性クラスタリング (95%以上の領域において、98%以上の相同性を持つタンパク質同士のグループ化) を行って、冗長性を取り除き、 ヒトのタンパク質間相互作用情報をH-InvDBのタンパク質セットに割り当てた結果、 9,268件のタンパク質からなる32,198件のヒトのタンパク質間相互作用情報が得られました。

ダウンロードファイル
H-InvDBのデータダウンロードから提供しています(http://h-invitational.jp/hinv/dataset/download.cgi)。 そこから、"Results of complational analysis" --> "Human protein complex database with quality index (PCDq), data set"をみてください。


4.12.4 よく表示されるアイコンの説明

or : タンパク質複合体情報へのリンクです。
or : タンパク質間相互作用 (PPI) 情報へのリンクです。()がある場合、対象タンパク質のPPI数を表します。
or : 対象タンパク質または対象タンパク質複合体のPPI map (描画ツール) へのリンクです。


4.12.5 タンパク質複合体の信頼性指標 (CQI) について

CQI (Complex Quality Index) は独自のタンパク質複合体の信頼性指標です。
タンパク質複合体アノテーションにおいて、複合体構成タンパク質のカテゴリーとして、以下の3つのカテゴリー分けを行っています。

CQIはタンパク質複合体全体の信頼性指標であり、上記カテゴリー別のタンパク質の数を並べた物として表されます。

CQI: ../複合体のタンパク質総数

すなわち、あるタンパク質複合体のCQI: 4.1.0/5 とすると、それは5つの構成タンパク質からなる複合体で、 そのうち4つのタンパク質がこの複合体を構成することが文献で知られており、 1つのタンパク質がこの複合体と関連する機能を持っていることが分かります。
また、CQI: 0.0.5/5であれば、それは5つの構成タンパク質からなる複合体で、そのうち5つのタンパク質がこの複合体を構成することが文献上確認できなかったことを表しており、全てカテゴリーIIIということはその複合体がPPIネットワークのみから予測された複合体 (仮想タンパク質複合体) であることを意味しています。


4.12.6 PCDqの検索機能

PCDqの検索機能は、タンパク質複合体の検索とPPIデータを持つタンパク質の検索の2種類の検索機能を提供しています。 また、タンパク質複合体の全リスト表示を提供しています。

タンパク質複合体の検索
検索窓に対象タンパク質複合体のキーワード、名前、説明、(構成タンパク質が持つ) Gene symbol、H-InvDBのID (HIX: gene cluster ID, HIT: transcript ID, HIP: protein ID)、タンパク質のAccession No. (UniProt, RefSeq, GI, CCDS, PDB)のいずれかを入力して、検索できます。

PPIデータを持つタンパク質の検索
検索窓にタンパク質間相互作用情報を調べたい対象タンパク質のキーワード、Gene symbol、H-InvDBのID (HIX: gene cluster ID, HIT: transcript ID, HIP: protein ID)、タンパク質のAccession No. (UniProt, RefSeq, GI, CCDS, PDB)のいずれかを入力して、検索できます。

検索結果画面
問い合わせに対してヒットしたタンパク質複合体、あるいはPPIデータを持つタンパク質の一覧が表示されます。


4.12.7 タンパク質複合体アノテーション情報画面 (Protein complex view)

タンパク質複合体のアノテーション項目は以下の通りです。

Complex type
タンパク質複合体の種類が表示されます。
Protein complex (stable interactions): 安定した生体高分子としてのタンパク質複合体、複合体として立体構造が解明されているものなど
Functional unit (transient interactions): 一時的な相互作用が組み合わさった機能単位としてのタンパク質複合体、代謝やシグナル伝達系など
Protein complex & functional unit (mixed): 上記両方に該当するもの

Functional category(ies)
タンパク質複合体の機能カテゴリーが表示されます。

Subcellular localization(s)
タンパク質複合体の細胞内局在情報が表示されます。

Complex name
タンパク質複合体の名称。

Description and evidences
タンパク質複合体に関する記述と参照元になった文献の情報を表示します。

CQI (Complex Quality Index)
構成タンパク質のカテゴリーより算出した、タンパク質複合体全体の信頼性を表す指標です。
"4.12.5 タンパク質複合体の信頼性指標 (CQI) について" の項を参照してください。

PubMed reference ID relations
複合体構成タンパク質と複合体と相互作用する周辺のタンパク質のPPIレベルでの文献、データリソース、実験手法の情報を表示します。


Fig 4.12.3 タンパク質複合体アノテーション情報画面 (protein complex view)

複合体構成タンパク質の詳細情報
複合体を構成するタンパク質 (赤の背景) と複合体と相互作用する周辺のタンパク質(青の背景) の詳細情報 (複合体構成タンパク質のカテゴリー, Accession No., 定義, EC No., Gene symbol, H-InvDBやPPI情報へのリンク,立体構造 (PDB), InterProドメイン, GO, 細胞内局在予測等) が表示されます。


Fig 4.12.4 複合体構成タンパク質の詳細情報(Protein complex view)

4.12.8 タンパク質間相互作用 (PPI) 情報画面 (PPI view)

タンパク質間相互作用情報が表示されます。問い合わせタンパク質 (赤色のタイトル) が上部に、問い合わせタンパク質と相互作用するタンパク質 (青色のタイトル) の一覧が下部に表示されます。


Fig 4.12.5 タンパク質間相互作用情報画面(PPI view)

相互作用するタンパク質の情報として表示される項目は以下の通りです。

Title
Protein ID: ヒトタンパク質の代表HIP ID
Symbol: タンパク質のシンボル
このタンパク質のPPI情報と描画ツールへのリンク。括弧内はPPI数。

Definitions
ヒトタンパク質の機能アノテーション情報が表示されます。

Protein Complex Information
このタンパク質が含まれるタンパク質複合体の名前とタンパク質複合体情報へのリンクが表示されます。

H-InvDB IDs
H-InvDBでは、遺伝子クラスター、遺伝子クラスターからのトランスクリプト(転写物)、トランスクリプトから翻訳されるタンパク質と一貫したデータを提供しています。
Gene cluster ID: HIX ID (H-InvDBの遺伝子クラスターID)
HIXをクリックするとLocus viewへリンクし、染色体上の遺伝子の位置を確認することができます。
Transcript ID: HIT ID (H-InvDBのトランスクリプトID)
HITをクリックするとTranscript viewへリンクし、詳細なトランスクリプト情報を確認することができます。
Protein ID: HIP ID (H-InvDBのタンパク質ID)
代表のHIP ID と同一タンパク質のHIP IDが表示されます。
HIPについては上述の"4.12.3 PCDqのデータ HIP: H-Invitational Protei"の項を参照してください。 同じ行に表示されているHIX、 HIT、 HIPはそれぞれ対応する遺伝子クラスター、トランスクリプト、タンパク質です。

Protein Accession Numbers
UniProt, RefSeq, GI, CDDS, PDBデータベースのタンパク質アクセッションナンバーです。 クリックするとそれぞれ各データベースへリンクします。

Human PPI cross reference information
タンパク質間相互作用の参照情報です。
Database cross reference information: データ元となったタンパク質間相互作用データベース(BIND, DIP, MINT, HPRD, IntAct, GNP_Y2H)へのリンク
PubMed IDs (Number of reporting PPIs): タンパク質間相互作用が報告された論文のPubMed ID
()内には論文で報告されているタンパク質間相互作用数が表示されます。 論文で報告されているタンパク質間相互作用の数は相互作用解析が大規模解析によるものか小規模解析によるものかを判断する指標となりますので参考にしてください。
※ただし、このタンパク質間相互作用数は論文中に記載されている実際の数と異なる場合があります。
Experimental methods: 実験方法の分類


Fig 4.12.6 対象タンパク質と相互作用するタンパク質の情報

4.12.9 タンパク質間-複合体間相互作用描画ツール (PPI-Map)

PPI-Mapは詳細ネットワーク表示画面と全体ネットワーク表示画面から構成されています。 詳細ネットワーク表示画面、全体ネットワーク表示画面共に、タンパク質は最小の点で表され、 タンパク質複合体は構成タンパク質の数に応じた大きさの点で表示されます。 また、相互作用を表す線の太さは以下に示すEdge Weightの値に応じて表示されます。

Edge Weight
タンパク質間-複合体間の相互作用数(の重み)を表します。
タンパク質間相互作用 (PPI) の場合、Edge Weightは常に"1"となりますが、タンパク質-タンパク質複合体間相互作用やタンパク質複合体間相互作用の場合は、 複合体の構成タンパク質同士のPPIを考慮するために、Edge Weightが大きくなります。

タンパク質複合体の表示色
タンパク質複合体の表示色はComplex typeと既知タンパク質複合体との一致割合により以下のように色分けしています。


Fig 4.12.7 タンパク質複合体の表示色

PPI-Map 詳細ネットワーク表示画面
閲覧対象のタンパク質/タンパク質複合体が中心に表示され、これと相互作用する周辺のタンパク質/タンパク質複合体が表示されます。 画面下部にはタンパク質/タンパク質複合体の詳細情報が表示されます。 また、表示されているいずれかのタンパク質/タンパク質複合体をマウスで選択しダブルクリックすると、 そのタンパク質/タンパク質複合体を閲覧対象とした詳細ネットワーク表示画面が別ウインドウで開きます。
Mode ボタン: Gene Symbol表示-ID表示-None表示が切り替わります。
Hide Node ボタン: 表示したくないタンパク質/タンパク質複合体をマウスで選択した状態でクリックすると非表示になります。
Reload ボタン: 初期画面に戻ります。
View CCI ボタン: 全体ネットワーク表示画面が表示されます。
スケールバー: 表示の拡大縮小が行えます。


Fig 4.12.8 PPI-Map 詳細ネットワーク表示画面

PPI-Map 全体ネットワーク表示画面
タンパク質複合体間相互作用の全体像が閲覧できます。
表示されているいずれかのタンパク質複合体をマウスで選択しダブルクリックすると、 そのタンパク質複合体を閲覧対象とした詳細ネットワーク表示画面が別ウインドウで開きます。
Edge Weight: 選択したEdge Weight (相互作用数) 以上の相互作用が表示されます。
Mode ボタン: Gene Symbol表示-ID表示-None表示が切り替わります。
Hide Node ボタン: 表示したくないタンパク質/タンパク質複合体をマウスで選択した状態でクリックすると非表示になります。
Reload ボタン: 初期画面に戻ります。
スケールバー: 表示の拡大縮小が行えます。


Fig 4.12.9 PPI-Map 全体ネットワーク表示画面

参考文献

  1. Kikugawa S, Nishikata K, Murakami K, Sato Y, Suzuki M, Altaf-Ul-Amin M, Kanaya S, Imanishi T. PCDq: human protein complex database with quality index which summarizes different levels of evidences of protein complexes predicted H-Invitational protein-protein interactions integrative dataset. BMC Syst. Biol. 2012. in press.
  2. Alfarano C, et al. The Biomolecular Interaction Network Database and related tools 2005 update. Nucleic Acids Res. 2005 Jan 1;33
  3. Salwinski L, Miller CS, Smith AJ, Pettit FK, Bowie JU, Eisenberg D. The Database of Interacting Proteins: 2004 update. Nucleic Acids Res. 2004 Jan 1;32
  4. Zanzoni A., Montecchi-Palazzi L., Quondam M., Ausiello G., Helmer-Citterich M. and Cesareni G. MINT: a Molecular INTeraction database. FEBS Letters. 2002, 513(1);135-140.
  5. Peri, S. et al. Development of human protein reference database as an initial platform for approaching systems biology in humans. Genome Research. 2003, 13:2363-2371.
  6. IntAct - an open source molecular interaction database. H. Hermjakob, L. Montecchi-Palazzi, C. Lewington, S. Mudali, S. Kerrien, S. Orchard, M. Vingron, B. Roechert, P. Roepstorff, A. Valencia, H. Margalit, J. Armstrong, A. Bairoch, G. Cesareni, D. Sherman, R. Apweiler. Nucl. Acids. Res. 2004 32: D452-D455.
  7. Altaf-Ul-Amin M, Shinbo Y, Mihara K, Kurokawa K, Kanaya S: Development and implementation of an algorithm for detection of protein complexes in large interaction networks. BMC Bioinformatics 2006, 7:207.