[ English ]

4.5 H-ANGEL -遺伝子発現プロファイル

The Human Anatomic Gene Expression Library (H-ANGEL) は、ヒトの遺伝子発現についての情報を提供するデータベースです。 H-ANGELは、H-Invitationalプロジェクトの構築した転写産物データに対する遺伝子発現パターンを表示します。遺伝子発現パターンは複数の測定プラットフォームを統合した組織特異的発現データに基づき、実用的な組織分類で表現しています。H-ANGELはまた、遺伝子の発現情報をヒトゲノム上の対応する物理的位置上に表示します。これらの情報は、H-InvDBに蓄積された対応する転写産物あるいは遺伝子座のアノテーションデータにリンクされており、こうした統合を通じて、プラットフォーム横断的に遺伝子発現データを比較して眺めることができます。H-ANGELに収録されたデータは転写産物あるいはゲノム配列の新たなbuildがリリースされる毎にアップデートしています。H-ANGELは大きく3つの方法に分類される7つの異なる遺伝子発現測定プラットフォーム、すなわち、PCR法を応用した、iAFLP (introduced amplified fragment length polymorphism)1,2, DNAマイクロアレイ法を用いた長鎖オリゴマーマイクロアレイ、オリゴマーマイクロアレイ3,4,cDNAマイクロアレイ5,6,7, 転写配列断片のカウントによる方法である、SAGE(Serial Analysis of Gene Expression)8,9, EST(Expressed Sequence Tag)10,11そして、 MPSS (Massively Parallel Signature Sequencing Technology)12による測定データを収集しています。H-ANGELの発現データは以下のURLからダウンロード可能です。
http://h-invitational.jp/hinv/dataset/download.html.
ファイル名: H-ANGEL matrix.

4.5.1 H-ANGELデータベースへのアクセス

1) H-InvDBより

H-InvDB内の特定のデータ項目に対する発現パターンを見るには、 H-Invホームページ、または、H-Inv DBのLocusまたはcDNA view の下方に並んだH-ANGEL アイコンH-ANGEL icon in H-InvDB Locus or cDNA viewをクリックすると、発現情報を表示する新しいブラウザが立ち上がります。

2) H-ANGELホームページへのアクセス

H-ANGELデータベースのトップページには以下のURLでアクセスできます。
http://h-invitational.jp/hinv/h-angel/.

4.5.2 H-ANGELビューの概略

H-ANGELの画面は以下のビューで構成されています。

1) ホームページ: ホームページから、他の2つのビューにアクセスし、2種類の方法でデータの検索ができます。

2) 発現パターンビュー: ホームページの 'H-Inv Locus Search for Gene Expression' からアクセスできます。表示対象のローカスを識別子やキーワードで検索し、遺伝子発現データを表示します。

3) 発現パターン検索ビュー: ホームページの 'Go to Pattern Search' からアクセスできます。ここでは、自由に発現パターンを定義してクエリーとし、それに似た発現パターンを示す遺伝子を検索できます。

4.5.3 H-ANGEL Sections

ホームページ

H-ANGELのホームページでは以下のような2通りの検索方法を使えます (Fig 4.5.1).

1) H-Invローカス検索

ここではH-Invで収集された転写物で発現パターンデータを含むものから、識別子あるいはキーワード検索によって関連したものを表示することができます。最初にプルダウンメニューからクエリーの種類(識別子の種類あるいはキーワード)を選び、下部のテキストフィールドにクエリーとする文字列を入力し、'Submit' ボタンをクリックしてください。

結果表示ページが現れ、発現パターンビューの中に与えられたH-Inv Locus IDに対応する発現データを表示します。検索に用いることのできる識別子ならびにキーワードの種類は以下のとおりです: H-Inv Locus ID, RefSeq / FLcDNA accession number of DDBJ/GenBank/EMBL International Nucleotide Sequence Database (INSD), UniGene ID, Locus Link ID、Definition lineに含まれるキーワードならびにRefSeq / FLcDNAのaccession番号からの遺伝子産物名。

2) 発現パターン検索

'Go to Pattern Search' ボタンをクリックすると発現パターン検索ビューに移動します。この画面では、10種類の組織カテゴリー (臓器を構成する主要な組織の大局的に見た組織学的分類) から構成される特定の発現パターンを定義して、そのパターンに似た発現パターンをもつ遺伝子を検索できます。この検索では、2種類の相関係数 (Pearson' s またはCosine) ならびに計測プラットフォームを選択することができます。


Fig 4.5.1 H-Angelのホームページ
発現パターンビュー

発現パターンビューは組織カテゴリーで分類された組織間の発現パターンのヒストグラムを表示します(Fig 4.5.2). ここには、以下の7種類の発現データセットが統合されています:1) iAFLP(JBIRC): JBIRCで実施されたiAFLP測定です。 2) iAFLP(Osaka Univ.): 大阪大学のBodyMapプロジェクトでのiAFLP測定です。 3) Long oligomer array: JBIRCの内部データで、長鎖オリゴマーマイクロアレイで測定されました。 4) GeneChip array U95Av2 (HuGEIndex): Affymetrix GeneChipTM による、 the Harvard Institute of Medicineで測定されたデータセット(HuGEIndex)です。 5) GeneChip array U95Av2 (LSBM): Affymetrix GeneChipTM による、 RCAST(東大)で行われた測定です。 6) cDNA microarray (CNRS): CNRSでおこなわれた、cDNAマイクロアレイによる測定です。 7) SAGE: Serial Analysis of Gene Expression で、Ludwig Institute for Cancer Researchからのものです。 8) BodyMap-EST: ヒト正常成人組織におけるSequence Tagsの数で、 dbEST (NCBI) ならびに BodyMap プロジェクト(大阪大学)データに由来します。 9) MPSS: Massively Parallel Signature Sequencing データです(九州大学の内部データ)。 Information of Genes カラムでは, H-Invでゲノム上の遺伝子座にマップされた遺伝子がエキソン/イントロン構造の情報とともに表示されます。画面上のこの領域には遺伝子の定義ならびにSAGEで測定された絶対発現レベルが表示されます。


Fig. 4.5.2 遺伝子発現パターンビュー

それぞれのデータセット中のすべてのサンプルは3段階に組織カテゴリー分類にマップされ (Fig. 4.5.3)、関連する発現レベルはそれぞれの組織カテゴリーに関して比較可能な値に変換されています。発現パターンビュー画面の 'Definitions for Tissue Categories' をクリックすると、それぞれのデータセットでデータ提供者によって与えられた組織名称と、それらに対応しH-Invコンソーシアムメンバーによって付与された組織分類との対照表を見ることができます。


Fig. 4.5.3 組織・臓器分類の3つのレベル


Fig. 4.5.4 H-ANGELにおける遺伝子発現データの標準化方法

H-Angelでは40種類の組織間での相対的発現レベルの値の合計が1になるように正規化しています(Fig.4.5.4)。ところで、ESTならびにBodyMap-ESTデータセット以外のデータセットは、40種類の組織のすべてをカバーしていません。発現データにおける測定組織の欠損は、組織間あるいは多数の測定プラットフォーム間での直接的な比較を困難にします。40種類の組織カテゴリーにわたる発現パターンの直接的比較にはこのような困難が生じるため、H-Angelでは関係する組織を論理的に代表する10種類の上位組織カテゴリーの集合を定義して、これら10種類それぞれの組織カテゴリーに対して、関係する組織での発現レベルの平均を計算しています。上の例では、胎盤、精巣、卵巣ならびに前立腺での発現量の比の平均を示しています。ある上位カテゴリーに含まれる組織に関して発現データが得られない場合は、最終的な計算にはその組織を含めていません。上の例でわかるように、上位グループ「生殖組織」は4種類の組織を含みますが精巣については発現データが存在しないので発現の値の総和は4ではなく3で除することになります。
遺伝子発現パターン画面では、画面左方に、それぞれの測定プラットフォームが当該遺伝子領域のどこでの発現を検出しているか(検出箇所)を図示します。検出箇所は、正確な位置がわかっている場合は短い垂直線で示されます。また、位置が同定てきない場合は青色の長方形で示されます。検出箇所データは遺伝子情報カラムにおける遺伝子構造情報に関連付けられています。この表示より、タグあるいはプローブの遺伝子上の位置を特定し、どのエキソンからの発現が測定されたかを容易に知ることができます。一方、画面右方に、10あるいは40種類の組織カテゴリーに対する発現パターンのヒストグラムが表示されます。
この画面の一部を構成する遺伝子発現テキスト情報画面 (Fig. 4.5.5) は当該遺伝子領域から生じたクローンに関係する、パブリックドメインにて入手可能な情報がもしあればテキストフォーマットで表示します。H-Inv Locusデータを選択するとこの画面を表示します。そのうちiAFLP情報ボックスにはiAFLP法でそれぞれの組織における遺伝子発現の測定条件についての情報が、またUniGene情報ボックスには当該遺伝子座に対応するUniGeneクラスターに含まれるクローンが検出された組織についての情報が表示されます。(複数の遺伝子座を表示する場合、この機能は動作しません)。


Fig. 4.5.5 遺伝子発現テキスト情報画面

発現パターン検索ビュー

発現パターン検索ビューでは興味のある発現パターンを持つ測定データと対象遺伝子を検索することができます (Fig. 4.5.6)。発現パターン定義ボックスを利用してそれぞれの上位組織カテゴリー間の相対発現レベルを表現するヒストグラムの高さを調節することによって、興味のある発現パターンを定義することができます。また、相関アルゴリズム選択ボックスで希望する相関係数の種類を定義できます。さらに、プラットフォーム選択ボックス中のチェックボックスをチェックすることによって検索対象の測定プラットフォームを特定できます。'Search' ボタンをクリックすると発現データのリストが発現パターン検索結果表示画面に表示されます(Fig. 4.5.7)。


Fig. 4.5.6 発現パターン検索ボックス

発現パターン検索結果表示画面には発現パターン検索ボックス(Fig. 4.5.6)で定義したパターンにヒットした発現パターンのリストが表示されます。また、この発現パターン検索結果表示画面はH-Inv Cluster ID, Accession No, 相関係数, 測定方法の種類、そして、10種類の上位組織クラス間での発現パターンを表示します。ここでH-Inv Cluster ID をクリックすると当該遺伝子座に対応する発現パターンビューページが開きます。


Fig. 4.5.7 発現パターン検索結果の例
Note:

現在のバージョンでは、H−ANGELのすべての測定プラットフォームが10種類の上位カテゴリーのデータをもっているわけではありません。CNRS ならびにMPSS データではいくつかのカテゴリーが欠けています。あるプラットフォームでの測定にカテゴリーの欠落がある場合、この種の検索クエリーに対しては結果が得られません。

4.5.4 H-ANGEL (H-InvDB_3.0) が使用しているすべての発現データセットの概要

測定方法 プラットフォーム 技術名称 データの測定または所有機関 H-Inv ローカスの数
PCRに基づく発現パターン測定 iAFLP Introduced Amplified Fragment Length Polymorphism JBIRC(Kousaku Okubo) 11,123
Osaka Univ(Kousaku Okubo) 7,755
DNAアレイ Long oligomers 80 nucleotide length oligomer chip JBIRC(Shinya Watanabe) 12,730
Short oligomers Affymetrix GeneChipTM Boston Univ.(HugeIndex) 2,725
Tokyo Univ.(Aburatani) 18,183
cDNA microarray cDNA nylon microarrays and cDNA glass microarray CNRS(Charles Auffray) 6,645
cDNA 配列断片タグ SAGE Serial Analysis of Gene Expression Ludwig Institute for Cancer Research 17,480
EST + BodyMap Expressed Sequence Tags NCBI 26,946
3'-directed cDNA library BodyMap
MPSS Massively Parallel Signature Sequencing NIG(Kousaku Okubo) 20,193

参考文献

  1. Kawamoto, S., Ohnishi, T., Kita, H., Chisaka, O. & Okubo, K. Expression profiling by iAFLP: A PCR-based method for genome-wide gene expression profiling. Genome Res 9, 1305-12. (1999).
  2. Sese, J. et al. BodyMap incorporated PCR-based expression profiling data and a gene ranking system. Nucleic Acids Res 29, 156-158 (2001).
  3. Haverty, P. M. et al. HugeIndex: a database with visualization tools for high-density oligonucleotide array data from normal human tissues. Nucleic Acids Res 30, 214-217 (2002).
  4. Ge, X., Yamamoto, S., Tsutsumi, S. & Aburatani, H. Comprehensive gene expression database of normal human tissues using oligonucleotide microarray. Submitted
  5. Pietu, G. et al. The Genexpress IMAGE knowledge base of the human brain transcriptome: a prototype integrated resource for functional and computational genomics. Genome Res. 9, 195-209 (1999).
  6. Pietu, G. et al. The Genexpress IMAGE knowledge base of the human brain transcriptome: a resource of structural, functional, and positional candidate genes for muscle physiology and pathologies. Genome Res. 9, 1313-20 (1999).
  7. Array s/IMAGE : http://www.vjf.cnrs.fr/FRE2571/, personal communication, unpublished. Note : the Array s/IMAGE (CNRS FRE2571, Genexpress, France)
  8. Velculescu, V. E., Zhang, L., Vogelstein, B. & Kinzler, K. W. Serial analysis of gene expression. Science 270, 484-487 (1995).
  9. Boon, K. et al. An anatomy of normal and malignant gene expression. 99 17, 11287-11292 (2002).
  10. Boguski, M. S., Lowe, T. M. J. & Tolstoshev, C. M. dbEST: database for Expressed Sequence Tags. Nat Genet 4, 332-333 (1993).
  11. Kawamoto, S. et al. BodyMap: a collection of 3' ESTs for analysis of human gene expression information. Genome Res 10, 1817-1827 (2000).
  12. Brenner, S. et al. Gene expression analysis by massively parallel signature sequencing (MPSS) on microbead arrays. Nat Biotechnol 18, 630-4. (2000).
更新日:2007年9月12日