用語集
オリジナル用語
- タンパク機能に影響を与えるAS: ORF内にASエクソンを含むRASVペアの中で、タンパク機能モチーフ・遺伝子オントロジー・細胞内局在化シグナル・膜タンパクドメインのいずれかが異なるもの
- ブリッジ: 複雑なASパターンの1つ。タンデムにマップされた2つの転写物のORFが、これらを橋渡しする転写物のORFと同じフレームで共有しているもの。参照: 複雑なASパターン
- 複雑なASパターン: ASによって生成されるタンパクが大幅に異なるパターン。ブリッジ・ネスト・二重CDSについて同定した。参照: 複雑なASパターン
- 保存AS: ヒトと他生物の間で転写物レベルで保存されたAS。具体的にはヒトのローカス内に異なるESVペア(またはクラスター)が2つ以上存在するもの。参照: RASVの比較ゲノム解析法
- 同一スプライシングバリアント(ESV): 転写物保存エクソンのみで構成されたヒトと他生物のRASVペア。参照: RASVの比較ゲノム解析法
- ゲノム保存: エクソンにおいては、エクソンの全長またはORF領域がゲノムアラインメントに閾値以上でマップされたものの、他生物の対応するエクソンが存在しない、または閾値以上で相似ではなかったもの。転写物においては、非保存エクソンを含まず、ゲノム保存エクソンを少なくとも1つ含むもの。参照: RASVの比較ゲノム解析法
- H-Invitational: 2002年および2003年に行われたヒト完全長cDNAのアノテーション会議
- HIT: H-InvDBで用いられる転写物のID。枝番(アンダーバーの後に数字)があるHITは、ゲノムの複数箇所にマッピングされた同一配列を示す
- HIX: H-InvDBで用いられる遺伝子座(ローカス)のID
- 二重CDS: 複雑なASパターンの1つ。200bp以上のORFを有する転写物同士で、マップ上ORFがオーバーラップしているものの、フレームがずれてアミノ酸配列が異なるもの。参照: 複雑なASパターン
- ネスト: 複雑なASパターンの1つ。転写物ペアのうち、転写物のどこかはオーバーラップしているが、ORFは全く共有していないもの。参照: 複雑なASパターン
- 非保存: エクソンにおいては、エクソンの全長またはORF領域がゲノムアラインメントに閾値以上でマップされなかったもの、またはゲノムアラインメントに存在しなかったもの。転写物においては、非保存エクソンを少なくとも1つ含むもの。参照: RASVの比較ゲノム解析法
- Other ASV: ASバリアントだが、代表ASバリアント(RASV)ではないもの
- 代表ASバリアント(RASV): ローカス内に複数現れる同じエクソン構造のASバリアントをグループ化し、そのグループの代表として選び出された1つのバリアント。参照: RASV判定の流れ図
- 転写物保存: エクソンにおいては、エクソンの全長またはORF領域がゲノムアラインメントに閾値以上でマップされ、なおかつ他生物の対応するエクソンとも閾値以上で相似なもの。転写物においては、全て転写物保存エクソンで構成されているもの。参照: RASVの比較ゲノム解析法
- 不完全転写物: マッピング情報から全長ではないと判定された転写物。参照: 不完全転写物の判定法
一般用語
- 選択的スプライシング: mRNA前駆体からイントロンがスプライスされ、再結合されるエクソンの組み合わせが異なることにより、複数種のmRNAが生成される現象
- 選択的3'スプライス: 基本的なASパターンの一つ。参照: RASVの判定法
- 選択的5'スプライス: 基本的なASパターンの一つ。参照: RASVの判定法
- 選択的第一エクソン: 転写開始に関係するASパターン。参照: RASVの判定法
- 選択的最終エクソン: 転写終結に関係するASパターン。参照: RASVの判定法
- カセット型エクソン: 基本的なASパターンの一つ。参照: RASVの判定法
- CDS: コーディング(タンパクに翻訳される)配列
- ESE: エクソン内に存在してスプライスを促進させるモチーフ配列
- ESS: エクソン内に存在してスプライスを抑制させるモチーフ配列
- 完全長cDNA: オリゴキャップ法などで5'末端を確定してクローニングされた転写物
- 遺伝子オントロジー(GO): 遺伝子の機能を構造的に定義して記述したもの
- ISE: イントロン内に存在してスプライスを促進させるモチーフ配列
- ISS: イントロン内に存在してスプライスを抑制させるモチーフ配列
- 相互排他的エクソン: 基本的なASパターンの一つ。参照: RASVの判定法
- NAGNAG: エクソンの3'末端に現れるスプライスサイト配列。Nはどの塩基でもよいが、出現頻度に偏りがある。E型とI型がある。参照: NAGNAGアクセプター
- ncRNA: ノンコーディング(タンパクに翻訳されない)RNA
- NMD: 最後のエクソン-エクソンジャンクションより55bp以上上流に終止コドン(未成熟終止コドン、PTC)がある転写物は、異常とみなされ翻訳されずに分解される現象
- ORF: 開始コドンと終了コドンに囲まれた、翻訳され得る配列
- タンパク機能モチーフ: 翻訳後に何かしらの機能を持つアミノ酸配列
- PTC: 選択的スプライシング等の結果により生じる異常な終止コドン
- 選択的保持イントロン: 基本的なASパターンの一つ。参照: RASVの判定法
- レトロトランスポゾン: 逆転写によってゲノム上に自身を増幅させる配列。LTRと非LTR(LINEとSINE)の2種類ある。ヒトのAluはSINEの一種
- SNP: 同種個体間で異なる一塩基単位の変異(多型)
- スプライスサイト配列: イントロンの両端2塩基ずつの配列。GT-AGとして高度に保存されているが、まれに異なる配列としてGC-AGとAT-ACがある。全てのスプライスサイト配列は、U2タイプのスプライソソーム(U1、U2、U4、U5、U6 snRNPを含む)によって認識される。AT-ACとGT-AGは、U12タイプのスプライソソーム(U11、U12、U4atac、U5、U6atac snRNPを含む)によって認識される。
- 細胞内局在化シグナル: 細胞内の特定の場所に存在するタンパクに特徴的なアミノ酸配列
- 膜タンパクドメイン: 膜タンパクのへリックス構造部のアミノ酸配列
- UTR: 非翻訳領域