研究内容
分子システム情報統合チームは、ヒト遺伝子と転写産物の統合データベースH-Invitational Database (H-InvDB)の構築を行うとともに、ヒトの分子システム情報の統合化と計算機解析により、進化や遺伝子発現などの生命現象の解明をめざした研究を行います。また、バイオ産業情報化コンソーシアムと協力して経済産業省統合データベースプロジェクトを実施し、ライフサイエンス分野のデータベースの整備と利用促進を図ります。
H-InvDBの紹介
H-InvDB http://www.h-invitational.jp/-
H-InvDBはヒトの遺伝子と転写産物を対象とした統合データベースです。ヒトのすべての転写産物の配列をあらゆる手法で解析することにより、 ヒト遺伝子の構造、 選択的スプライシング変異体、 機能性RNA、タンパク質としての機能、 機能ドメイン、 細胞内局在、 代謝経路、 立体構造、 疾病との関連、 遺伝子多型(SNP、マイクロサテライト等)、 遺伝子発現プロファイル、 分子進化学的特徴 などの精査されたアノテーション(注釈付け)情報を提供しています。このデータベースは、H-Invitationalプロジェクトで確立したヒト完全長cDNA配列のアノテーション技術を基礎として、「ゲノム情報統合プロジェクト」(2005-)によって構築されました。
H-InvDBでは、転写産物に対するアノテーションはcDNA viewに、遺伝子座に対するアノテーションはLocus viewに表示されます。
Transcript view (転写産物アノテーションデータ表示画面)
Transcript view(旧:cDNA viewまたはmRNA view)では、各HIT(H-Invitational transcript) に対する遺伝子機能、CDS予測、機能性モチーフ予測、ジーンオントロジー(GO)、細胞内局在予測・立体構造予測等のアノテーションデータを表示しています。
Locus view (遺伝子座アノテーションデータ表示画面)
Locus viewでは、各HIX(H-Invitational cluster)に対するゲノム上位置、遺伝子構造、スプライシング変異体、遺伝子発現プロファイル、疾患との関連等のアノテーションデータを表示しています。
H-InvDBの7つのサブデータベースの紹介
G-Integra http://www.h-invitational.jp/hinv/g-integra/html/- G-integra(genome integrated database)は、ヒト、マウス、チンパンジー、ラットのゲノム地図と遺伝子構造をブラウザ上で表示することができるゲノム情報統合データベースです。HITのヒトゲノム上の位置と遺伝子構造(緑色)および対応するRefSeqとEnsembl遺伝子の構造(赤色)が表示されます。
H-Angel http://www.h-invitational.jp/hinv/h-angel/wge_top.cgi?- H-ANGEL(Human ANatomic Gene Expression Library)はヒト遺伝子の発現プロファイルデータベースです。7つのプラットフォーム、3種の実験手法から得られた、ヒト成人健常人の組織の遺伝子発現データを収集、10および40の組織・細胞カテゴリーに分類し、各HIXの発現情報プロファイルを提供しています。
DiseaseInfo Viewer - DiseaseInfo Viewerは、既知疾患遺伝子と遺伝子座上に同座する遺伝性の形質についての情報を提供するデータベースです。
TOPO - TOPO Viewerは、WoLF PSORTとTargetPによって予測された細胞内指向シグナル(subcellular targeting signals)、およびSOSUIとTMHMMによって予測された膜貫通へリックスの予測結果を提供するツールです。
Clustering Viewer- Clustering Viewerは、cDNAを基盤としたクラスタリングの結果とマッピングを基盤としたクラスタリング結果を参照し、クラスタリング手法の比較を行うためのビューアーです。
Evola http://www.h-invitational.jp/evola/search.html- ヒトとマウスやラットなどのモデル生物とのオルソログ情報を格納する分子進化データベースです。オルソログ配列にUniProtなどから得られた全生物の相同な配列を加えて作成したアラインメントと系統樹を提供しています。
PPI view http://www.h-invitational.jp/hinv/ppi/- PPI viewは、ヒトのタンパク質間相互作用 (PPI: Protein-Protein Interaction) 情報のデータベースです。
その他のデータベースとツール
PANDA: Priority ANalysis for Disease Association- PANDAシステムは、新規疾病関連遺伝子は既知の疾病関連遺伝子と類似した機能を有するという考えを元に構築され、ゲノム上の候補領域から新規疾病感受性遺伝子を同定することを目的としたシステムです。
LEGENDA:Literature-Extracted GENe-Disease Associations
http://www.h-invitational.jp/legenda/- LEGENDAは、「疾患、遺伝子、物質」間の関係についての情報を、全てのMEDLINE文献情報から抽出して提供するデータベースです。
H-GOLD: Human-Gene diversity Of Life-style related Disease http://jbirc.jbic.or.jp/gdbs/- ゲノム配列を元にin silicoでゲノムワイドに検出し、実際に日本人集団において多型性を確認した約3万のマイクロサテライトマーカーを格納したデータベースです。
Evolgen:多重比較ゲノムデータベース- Evolgenはヒト、チンパンジー、マウス、ラットの遺伝子ファミリー情報を格納するデータベースです。ヒトの遺伝子ファミリーを構成するそれぞれの遺伝子について、オルソログの有無を確認することができます。
G-compass:比較ゲノムウェブツール http://www.h-invitational.jp/g-compass/- ゲノムアライメントに基づくヒト-チンパンジー、ヒト-マウス、ヒト-ラット間の保存領域のデータベースです。保存領域に対するBLASTサーチ・遺伝子名やキーワードによる検索を行うことができ、ゲノムアラインメントごとに様々な解析結果(塩基置換率・GC含有率のウィンドウ解析など)をグラフィカルに表示します。
TACT:Transcriptome Auto-annotation Conducting Tool http://www.h-invitational.jp/tact/- H-InvDBでの自動解析(相同性検索、ORF予測、モチーフ検索)を統合し、真核生物遺伝子の機能を自動予測できる統合的自動アノテーションシステムです。
H-DBAS:Human DataBase of Alternative Splicing http://www.h-invitational.jp/h-dbas/- 選択的スプライシング(alternative splicing: AS)変異体のデータベース。
H-InvDBとH-InvDBサブデータベースの画面構成
