[ English ]

2.2 H-InvDBアノテーション:選択的スプライシングバリアント

2.2 選択的スプライシングバリアント

各遺伝子座(ローカス)における選択的スプライシング(Alternative Splicing; AS)バリアントおよびそのASパターンは、機械的なパイプラインによって自動的に決定されます。この方法はH-Invitational会議の期間中に確立され、全ヒト遺伝子データセットにおいて適用されました。そのアルゴリズムは以下の通りです。まず、アラインメントされた転写物のエキソン情報を基にゲノム配列上のエキソン-イントロン境界の正確な位置を決定します。次に、各境界の位置を同じ遺伝子座内の別の境界と比較します。比較の際には、10bpの幅をもたせます。そして、ゲノム配列上においてある転写物の最初または最後のエキソンの一部が別の転写物のイントロンに含まれる場合、これらを5'-endあるいは3'-end ASとみなします。また、内部のエキソンの場合はInternal ASとみなします(Fig. 2.2.1)。ASバリアントのスプライシングパターンも同時に判定され、5つの典型的なタイプ(カセット型エキソン、選択的3'スプライス、選択的5'スプライス、相互排他的エキソン、選択的保持イントロン)に分類されます(Fig. 2.2.2)。


Fig. 2.2.1 AS判定およびAS位置の分類法のスキーム


Fig. 2.2.2 ASパターンの分類

更に、判定されたASバリアントの中には同じ遺伝子構造を持つものが存在するため、その中から解析に使用するASバリアントを一つだけ選びました。我々はそれを代表ASバリアント(Representative AS Variant; RASV)と呼んでいます。これらを用い、ASによって引き起こされるタンパク機能(モチーフ、GO、細胞内局在化シグナル、膜タンパクドメイン)の相違を網羅的に調べました。それらの結果は論文にまとめられ、データはH-InvDBのサテライトデータベースであるH-DBAS(http://h-invitational.jp/h-dbas/)に登録されています。

参考文献
Takeda, J. et al. (2007) H-DBAS: Alternative splicing database of completely sequenced and manually annotated full-length cDNAs based on H-Invitational. Nucleic Acids Research 35 (Database issue), D104-D109

Takeda, J. et al. (2006) Large-scale identification and characterization of alternative splicing variants of human gene transcripts using 56,419 completely sequenced and manually annotated full-length cDNAs. Nucleic Acids Research 34 (14), 3917-3928

更新日:2008年1月30日