[ English ]

9.0 H-InvDB用語集

A B C D E F G H I J K L M N O P Q R S T U V W X Y Z
a b c d e f g h i j k l m n o p q r s t u v w x y z
あ行 か行 さ行 た行 な行 は行 ま行 や行 ら行 わ行
BodyMap-EST
BodyMap-ESTはBodyMapデータベースからのデータセットです。BodyMapは、1993年に開発されたヒトならびにマウスの遺伝子発現データベースです。大阪大学にて、組成の変化をきたすような操作なしに調製されたcDNAライブラリから3'末端の制限酵素断片として作成されたExpressed Sequence Tag (EST)配列に基づき、ヒト、マウスそれぞれ60ならびに38の組織から検出された270,000配列以上の配列を含みます。3'末端の制限酵素断片からのタグ配列なので、個別の転写産物を代表するタグを正確に分類することができ、同時に、組織内での各転写産物の量についての情報を提供します。
CAGE tag
Cap Analysis Gene Expression (CAGE) tag とは、CAGE法により実験的に決められた転写産物の5'末端配列です。データはゲノムネットワークのサイト(http://genomenetwork.nig.ac.jp/public/contents/description.html)で公開されています。
DiseaseInfo Viewer
DiseaseInfo Viewerは、H-InvDBにおける疾患関連情報を表示するビューアーです。このビューアーでは、H-Inv Locusにおける既知疾患遺伝子情報およびH-Inv Locusの1,000kb上下流に位置する稀少難病に関連する領域の情報を提供しています。
E-value
アラインメントスコアの統計的有意性を示す指標であり、値が小さいほど、 その結果は偶然でない確かな一致であるとみなすことができ、統計的に有意であると言えます。(詳細は "http://www.ncbi.nlm.nih.gov/BLAST/tutorial/Altschul-1.html#head2"を参照下さい。)
Ensembl
Ensemblとはサンガー研究所とEBI/EMBLの共同プロジェクトの名称であり、真核生物のゲノムに対する自動アノテーションシステムを開発しています。http://www.ebi.ac.uk/ensembl/
Evola
ヒトとモデル生物とのオルソログ情報を提供する、世界最大級のオルソログデータベース。H-InvDBの約2万のヒト遺伝子について、配列と系統樹の解析に基づく13種の脊椎動物(チンパンジー、マウス、イヌ、ニワトリ、フグなど)とのオルソログ情報を提供しています。
G-integra
G-integraとは主にH-Inv transcriptにより定義された遺伝子構造を表示するためのゲノムブラウザです。遺伝子構造情報の他、様々なゲノムアノテーション情報を格納しており、ある特定の領域のゲノムアノテーション情報を視覚化することができます。
H-ANGEL
Human Anatomic Gene Expression Libraryの略称 です。さまざまなプラットフォーム上で測定されたデータセットを集成した、正常成人組織間の遺伝子発現プロファイルデータベースです。H-invDBの遺伝子へのリンクと、サンプルの解剖学的分類とによって、個々の遺伝子についてプラットフォーム間の遺伝子発現パターンが比較可能になっています。
H-Inv cDNA
H-Invitationalプロジェクトで収集されたcDNAクローン、またはそのcDNA配列です。合計56,419のcDNAが6つの研究所およびDDBJから提供され、2003年9月1日にデータセットが決定しました。
H-Invitationalプロジェクト
人手によるアノテーションを施した高品質なcDNAデータベースの構築を目的とし、生物情報解析研究センター(産総研およびJBIC)と遺伝研DDBJが主体となって2002年から始まったプロジェクトです。2002年8月25日-9月3日に、ヒト完全長cDNAアノテーションインビテーショナル会議 (H-Invitational meeting) が開かれ、全44機関、12カ国の約120名が参加し、アノテーション方針の議論と実際の機能アノテーションが実施されました。その後、2003年11月10日-15日に、cDNAデータの追加とアノテーションの高度化をめざしたアノテーション会議、H-Invitational 2が開催されました。その成果ですデータベースは、2004年4月16日にH-InvDBとして http://www.h-invitational.jp/ に公開されました。その後は、後継の「ゲノム情報統合プロジェクト」として続いています。
HIP
HIP (H-Invitational protein) ID: 転写産物配列の予測CDSアノテーション情報をデータベース化し、ユニークなアミノ酸配列に対しH-Invitational protein(HIP)ナンバーというIDを付与しました。形式:HIP + 9桁の数字 + version番号 例)HIP000000001.1
HIT
HIT (H-Invitational transcript) ID: 形式:HIT + 9桁の数字 + version番号 例)HIT000000001.1 転写産物(cDNA, mRNAなど)配列のアノテーション情報をデータベース化し、H-Invitational transcripts(HIT)ナンバーというIDを付与しました。*) 転写産物がゲノム上の複数箇所に同一条件でマップされる場合、HIT IDに枝番を付与しています。形式:HIT + 9桁の数字 + version番号 + 枝番 例)HIT000000001_01.1
HIX
HIX (H-Invitational cluster) ID: ヒトゲノム上の重複を除く遺伝子クラスター遺伝子クラスターをH-Invitational cluster(HIX)と定義し各遺伝子座単位にIDを付与しました。形式:HIX + 7桁の数字 + version番号 例)HIX0000001.1
Locus view
Locus viewは遺伝子座アノテーションデータ表示画面です。各HIX(H-Invitational cluster)に対するゲノム上位置、遺伝子構造、スプライシング変異体、遺伝子発現プロファイル、疾患との関連等のアノテーションデータを表示しています。
MutationView
疾患に関係する遺伝子変異の情報を統一したビジュアルな環境で表示するデータベースです。疾患発症器官・組織、発症集団、ゲノム位置、遺伝子構造、変異の症例数、スプライス・サイトの変異によるスプライシング変化予想などが含まれます。また、該当する遺伝子について、配列データベース、OMIM、GDB、H-InvDB等の外部データと有機的にリンクされています。慶応大学・浜松医科大学によってデータの収集・手動キュレーションがなされ、データベースソフトが構築されました。
NJML+法
NJ法とML法の特徴をあわせ持ち、より正確な系統樹を作成するために提唱されたNJML方法(Ota and Li 2000)のアミノ酸配列版です(Ota and Li 2001)。
NJ法
近隣結合法。最もよく利用される系統樹作成方法の一つです。コンピュータパワーをそれほど必要とせずに信頼度の高い系統樹を作成することができます(Saitou and Nei 1987)。
PPI view
PPI viewは、ヒトのタンパク質間相互作用 (PPI:Protein-Protein Interaction) 情報の表示を行います。主要な5つのPPIデータベースから、データの収集・統合を行い、H-InvDBの独自予測されたタンパク質についてPPIの割り当てを行いました。
RefSeq
NCBIより提供されているタンパク質配列、DNA・RNA配列の非冗長なデータセットです。詳しくは"http://www.ncbi.nlm.nih.gov/RefSeq/" を参照して下さい。
Repeat Mask Viewer
Repeat Mask Viewerは反復配列情報表示画面です。Repeat Maskerによって各HIT(H-Invitational transcript) に検出された反復配列の情報を表示しています。
Transcript view
Transcript view は転写産物のアノテーションデータ表示画面です。各HIT(H-Invitational transcript) に対する遺伝子機能、CDS予測、機能性モチーフ予測、ジーンオントロジー(GO)、細胞内局在予測・立体構造予測等のアノテーションデータを表示しています。
UCSC
カリフォルニア大学サンタクルス校(University of California Santa Cruz)のゲノムバイオインフォマティクスグループを指します。このグループは、多くの生物種の最新の全ゲノムアセンブリを提供しているとともに、そのゲノムブラウザは、世界で最もよく利用されているものの一つです(http://genome.ucsc.edu/)。
UniProt
Universal Protein Resourceの通称です。世界で最も大規模かつ網羅的に様々な生物のタンパク質情報を提供しているデータベースです(http://www.uniprot.org/)。
canonical splice site
GU-AG スプライスサイトのことを示し、全スプライスサイトの99%以上を占めるとされています。
cDNAマイクロアレイ(CNRS)
仏CNRSが収集したヒト転写産物クローン (I.M.A.G.E クローン)をスライドガラス上基材に貼付したマイクロアレイです。
dN/dS
非同義置換サイトでの塩基置換率(dN)を同義置換サイトでの塩基置換率(dS)で割ったものです。遺伝子配列に及ぼされる自然選択圧を表す指標として分子進化学で広く用いられています。Ka/Ksともあらわします。正の選択、負の選択も参照してください。
est2genome
EMBOSSパッケージに梱包されているスプライスアラインメントツールであり、H-InvDBでは転写物の配列をゲノムへマッピングする際に用いています。
modified Nei-Gojobori method
タンパク質をコードする配列(CDS)での、同義置換サイトと非同義置換サイトの数を検出する方法として広く用いられているものの一つです(Nei and Gojobori 1986, Zhang et al. 1998)。
アラインメント
アラインメントとはある物を他の物との関連性によって整列したりすることです。バイオインフォマティクスに置いては 配列の相同性を表示するための"配列のアラインメント"のことを示すことが多く、機能や構造、進化によって生み出される配列の類似性を同定するために、DNA、RNAやタンパク質配列をギャップと呼ばれる空白を用いて整列する方法です。
遺伝子座
染色体上の遺伝子が存在する位置です。
オリゴマーマイクロアレイ(GeneChip array U95Av2)
GeneChipは、Affymetrix社のDNAオリゴマーマイクロアレイの登録商標です。プローブ長は25塩基で、配列の異なる箇所に特異的にマッチするプローブの集団が遺伝子に対するプローブセットを構成します。いくつかのバージョンがあり、U95はもっとも早期のものです。
オルソログ(オーソログ)
共通祖先遺伝子から種分化によって受け継がれた遺伝子です。生物種間で遺伝子の比較を行うにあたり、機能と構造が通常、最も対応すると考えられます。例えば、ヒトのαヘモグロビンとマウスのαヘモグロビンはオルソログです。種分化後に種特異的な遺伝子重複や欠失が起こるなどで、必ずしも1対1の関係に限定されません。
機能性RNA
様々な生物学的に重要な機能を示すncRNAです。mRNA様の比較的長さの長いncRNAとmiRNA、piRNA、snRNA、snoRNA、scaRNAといった長さの短いncRNAがあります。ただし、有効配列長が30bp未満であるmiRNAは、H-Inv DBでの対象外です。
クラスター
H-InvDBでは、主に同一の遺伝子座に属する転写産物のグループをクラスターと呼びます。
クラスターメンバー
H-InvDBでは、主に同一の遺伝子座に属する転写産物のことを指します。
クラスタリング
H-InvDBでは、主に同一の遺伝子座に属する遺伝子のかたまりに分類することを表します。
ゲノム情報統合プロジェクト
ヒト遺伝子の完全なカタログを作成して各種の有用なアノテーション情報を付与し、データベースとして公開することを目的として、社団法人バイオ産業情報化コンソーシアムが産業技術総合研究所生物情報解析研究センター他と共同で行っている経済産業省が公募したモデル事業です。2005年6月15日にはじまり2008年3月31日で終了予定。「H-Invitationalプロジェクト」の後継事業です。
自然選択
塩基配列に起こる突然変異が生物集団中で広まったり(定着)、除去されたりする過程。個体の生存に有利か不利かに応じて、正の選択(突然変異の定着)と負の選択(突然変異の除去)があります。その結果として、突然変異は有害、中立、有利なものに分類されます。
シンテニー領域(シンテニック領域)
生物種間で遺伝子が同じ向きと順番で並んでいること、またはそのようなゲノム(染色体)の相同領域です。共通祖先のゲノム(染色体)が進化の過程で再編成を経て保存されている領域をさします。
正の選択
個体にとって有利な突然変異が生物集団に広まり定着する自然選択です。種間で正の選択が働くゲノム領域は低い配列保存度を示します。遺伝子のタンパク質コード領域では、同義置換率と比較して非同義置換率が大きくなる傾向があります(dN/dS > 1)。このような遺伝子は新しい機能と構造を持っている可能性があります。
選択的スプライス変異体の位置
選択的スプライス(AS)変異体に含まれるASエキソンが、転写産物上に存在する位置により、5’-end、internal、3’-endに分けられます。一つのAS変異体が全てを含むこともあります。
選択的スプライス変異体のパターン
選択的スプライシング(AS)のパターンには基本的なものが5つあり、多くのAS変異体はこれらを複雑に組み合わせたエキソン構造をとります。その5つのASパターンとは、1) カセット型エキソン、2) 選択的3’スプライス、3) 選択的5’スプライス、4) 相互排他的エキソン、5) 選択的保持イントロンです。
タンパク質間相互作用
タンパク質間相互作用 (PPI: Protein-Protein Interaction) とは、タンパク質分子間の相互作用のことです。タンパク質は、他のタンパク質や生体高分子と相互作用することでその機能を発揮するものがほとんどであり、タンパク質の機能を解明する上でタンパク質間相互作用は必要不可欠な情報です。
代表AS変異体
一つの遺伝子座に複数のエキソン構造が異なる転写産物が存在する場合、それらを選択的スプライシング(AS)変異体と呼びます。AS変異体グループの中には、複数の転写産物が存在する場合がある。これらは同じエキソン構造ですため、冗長性を省くためには各AS変異体グループから代表の転写産物を一つだけ選ぶ必要があります。これを代表AS変異体と呼びます。
長鎖オリゴマーマイクロアレイ
NEDO「タンパク質機能解析」プロジェクトの1分室によって開発されたマイクロアレイで測定されたデータです。プローブ長は50-60塩基です。
低複雑配列
プロリンリッチなタンパク質のアミノ酸配列に代表されるように、特定の塩基(残基)が連続している配列を指します。相同性検索時に膨大な意味の無い相同性結果を出す等の妨げになります。
転写型偽遺伝子
偽遺伝子は、転写も翻訳も行われないのが通常ですが、中には翻訳機能やタンパク質としての機能を失ったが、転写機能を保持しているものが存在します。そのようなものを転写性偽遺伝子といいます。
同義置換
アミノ酸を変化させない塩基置換です。
ナビ
H-InvDBのサーチ機能(画面)の1つです。詳細検索(advanced search)の画面よりも分かりやすく、初心者でも使いやすい検索機能として設けられたもので、ユーザの解析の目的によって検索項目を選択していくと検索ができるページです。
パラログ
生物種内で遺伝子重複によって生じた遺伝子です。多くの場合、塩基またはアミノ酸配列が相同な重複遺伝子ファミリーを構成します。例えば、ヒトのαヘモグロビンとβヘモグロビンはパラログです。
非タンパク質コード遺伝子
タンパク質に翻訳されることのない遺伝子です。その中には機能性RNAが含まれます。
非同義置換
アミノ酸を変化させる塩基置換です。
負の選択(浄化選択)
個体にとって有害な突然変異が生物集団から除去される自然選択。種間で負の選択が働くゲノム領域は高い配列保存度を示します。遺伝子のタンパク質コード領域では、同義置換率と比較して非同義置換率が小さくなる傾向があります(dN/dS << 1)。
ホモログ
ある遺伝子について、相同な塩基配列またはアミノ酸配列を持つ遺伝子。通常、進化系統上で遺伝子重複によって生じます。詳細にはオルソログまたはホモログに分類されます。
予測遺伝子
ゲノム配列情報から遺伝子(タンパク質コード領域)予測プログラムによってその構造が予測された遺伝子です。ここでいう遺伝子予測プログラムとは、タンパク質をコードしている領域やスプライス部位の配列パターンの候補を統計的手法で検出し、全体の遺伝子構造を統合的に予測するプログラムであり、GENSCAN、 FGENESHなどを用いています。H-InvDBでは、単独の予測プログラムの結果を統合するプログラムJIGSAWを用いた、より精度の高い(擬陽性の少ない)予測結果を提供しています。
更新日:2008年12月18日