広報活動

Print

2009年4月23日

独立行政法人 理化学研究所

ゲノムの反復配列が遺伝子の発現コントロールに必須の役割

-発現調節だけでなく進化にもかかわる新たなゲノムの全体像-

ポイント

  • 約25万種類ものRNAが反復配列から転写されていることを発見
  • 反復配列が多くの遺伝子の発現制御に関与していることをゲノムワイドに証明
  • ほ乳類の進化の過程で、レトロトランスポゾンを利用して多様性を獲得してきたことを示唆

要旨

独立行政法人理化学研究所(野依良治理事長)は、大規模データ解析により、ゲノムの多くを占めていて、主にレトロトランスポゾン※1やその残骸などに由来する反復配列※2が生物にとって必須の働きをしていることを明らかにしました。理研オミックス※3基盤研究領域 (OSC、林崎良英領域長)ゲノム機能研究チーム(ピエロ・カルニンチ チームリーダー)が、「国際FANTOMコンソーシアム※4」(統括:林﨑良英)の活動の一環として、文部科学省ゲノムネットワークプロジェクト※5と連携した研究成果です。

これまでの研究から、ほ乳類のゲノムの約45%は、反復配列からなっていることが分かっていました。これら反復配列は、さまざまな役割を持つことが推定されていましたが、全ゲノムにわたって解析することが困難でした。今回、研究グループでは、理研OSCが開発したCAGE(Cap Analysis of Gene Expression)法※6を用いて、これらの転写産物をゲノムワイドに調べた結果、ヒトおよびマウスのRNAの約30%が、反復配列の中に転写開始点があることがあることを見いだしました。このようなRNA約25万種類を詳しく分類したところ、その発現が細胞ごとに異なることや、遺伝子が高密度に存在するゲノム領域に特に集中的に存在していることが分かりました。中でも、タンパク質をコードしている遺伝子の先頭部分に位置する反復配列は、選択的プロモーター※7として働き、細胞や発生段階に応じて転写するRNAを切り替えていることを突き止めました。一方、RNAの末尾部分に反復配列があると、そのRNAの発現が抑制されることもわかりました。このことから、反復配列が遺伝子の発現をさまざまな機構で制御していることが強く示唆されます。

今回の成果により、ほ乳類の進化の過程で、レトロトランスポゾンに含まれるプロモーター活性をもつ反復配列が、ゲノム上のさまざまな位置に挿入され、それまでは転写されていなかった遺伝子を発現させるようになったと推定されます。その多くは、現在ではもはやレトロトランスポゾンとしての機能は失い、生物にとって必須の転写制御という役割をもつに至ったものと考えられます。

今回の成果は、米国の科学雑誌『Nature Genetics』の特集号に掲載されるに先立ち、4月19日(日本時間4月20日)付でオンライン掲載されました。

背景

ヒトをはじめとするほ乳類のゲノム解読が行われた結果、ほ乳類ゲノムの約45%は、レトロトランスポゾンやその残骸などに由来する反復配列であることが明らかになりました。しかし、これほど多くの部分を占めるにもかかわらず、反復配列の存在意義はよく分からず、大半が「がらくた」と考えられたこともありました。最近になって、いくつかの限られた遺伝子についての研究から、これらの反復配列が、遺伝子発現制御にかかわり、進化における新たな機能の獲得との関連があると指摘されてきました。しかし、従来のマイクロアレイ※8を用いた方法では、ゲノム上に多数ある反復配列の複数個所に、同じ認識配列で結合してしまうことが障害となり、ゲノム全体にわたって反復配列と遺伝子発現の関連を調べることはできませんでした。

研究手法と成果

FANTOMは、理研のマウスエンサイクロペディアプロジェクト※9で収集した完全長cDNAのアノテーション(機能注釈)を行うことを目的に、2000年に結成された国際研究コンソーシアムで、参加国数が15カ国、参加機関が51機関に上ります。 これまでにFANTOM 1~4の4つの段階※10の活動を行ってきました。アノテーションパイプラインの確立を目指したFANTOMの活動は、急速に発展・拡大し、FANTOM3では、トランスクリプトーム解析からRNA新大陸※11の発見をもたらし、大きな反響を与えました。RNA新大陸の発見は、FANTOM3の活動と文部科学省ゲノムネットワークプロジェクトの活動で得た成果です。最新のFANTOM4プロジェクトでは、本研究成果のほかに、転写制御ネットワーク※12の解明や(2009年4月20日プレスリリース)、新しいRNAの発見と特徴を詳しく解析し、報告しました。このFANTOM4で用いた独自術であるCAGE法では、転写されたRNAの先頭部分(Capサイト)を捕捉して、その塩基配列を決定し、ゲノム配列と比較することで転写開始点をきわめて正確に同定すると同時に、その転写開始点ごとの発現量をほぼ定量的に計測することができます。

そこで、研究グループでは、このCAGE法により、ヒトで12種類、マウスで13種類の組織について、ゲノム全体にわたる転写開始点のマップを作成しました。これをもとに、反復配列と遺伝子発現の関連を調べたところ、マウスで44,264種類、ヒトで275,185種類の転写開始点が反復配列の中にあることが明らかになりました。これは、これまでにわかっている転写開始点のうち、マウスでは18.1%、ヒトでは31.4%に上ります。さらに、組織ごとに精査すると、ヒトでは特に胚で発現している遺伝子に反復配列と関連あるものが多く、およそ30%に上ることがわかりました。このほかにも、反復配列の発現には組織特異性が見られ、何らかの機能と関連していることが予想されました。

次に、タンパク質をコードする遺伝子に注目して、反復配列と遺伝子発現の関連を調べました。この結果、マウスで15,518種類、ヒトで117,165種類の反復配列部分が選択的プロモーターとして働いている可能性が示唆されました。これらのうち、ヒトの24種類の反復配列を選んで、ヒト白血病由来の免疫細胞株(THP-1)やヒト肝臓がん由来細胞株(HEPG2)を用いて発現実験を行うと、15種類が実際に選択的プロモーターとして機能していることを実証しました。

一方、RNAの末尾部分(3’末端)に注目すると、マウスで27.7%、ヒトで28.5%のRNAが反復配列を含んでいることがわかりました。このようなRNAは、まったく反復配列を含まないRNAに比べて、発現量が約60%も少ないことが明らかになりました。

今回の成果から、ほ乳類ゲノムの約45%を占める反復配列が、転写をコントロールする役割を果たしており、個体の発生と生存に必須のものであることが明らかになりました。この事実は、ほ乳類が進化の過程で、時には生存の脅威ともなるレトロトランスポゾンを逆に利用して、新たな遺伝子を発現させ、多様性を獲得していたことを示唆するものです。

今後の期待

今後、これらの反復配列がどのようなメカニズムで転写を制御しているのかに関する詳しい研究が進むものと期待されます。

将来的には、反復配列を制御することで、iPS細胞や皮膚の細胞を、目的とする細胞に分化させるといった技術の一部として、再生医療につなげられるよう研究を進めていきます。

発表者

理化学研究所
オミックス基盤研究領域 ゲノム機能研究チーム
チームリーダー Piero Carninci(ピエロ・カルニンチ)
Tel: 045-503-9222 / Fax: 045-503-9216

お問い合わせ先

横浜研究推進部 企画課
Tel: 045-503-9117 / Fax: 045-503-9113

報道担当

理化学研究所 広報室 報道担当
Tel: 048-467-9272 / Fax: 048-462-4715

このページのトップへ

補足説明

  1. レトロトランスポゾン
    ゲノム上の別の位置に転移することのできる塩基配列。転移はゲノムのDNA配列を変化させることで突然変異の原因となり、これに起因する疾患も多数知られている。一方、多様性を増幅することで生物の進化を促進してきたとも考えられている。
  2. 反復配列
    ゲノム上で特定の塩基配列が繰返し出現する配列のことを指す。反復配列には、短いパターンが何度も繰り返す配列や、レトロトランスポゾンなど、種々のタイプのものがある。
  3. オミックス (Omics)
    生体のもつあらゆる分子情報を解析・解明しようとする研究のこと。ゲノム(genome)は遺伝子(gene)の総体(gene+ome)であり、ゲノムの分子情報を解明しようとする研究を語尾に-omicsをつけ、ゲノミクス(genomics)と呼ぶ。同様に、遺伝子からの転写物の総体であるトランスクリプトーム(transcriptome)、タンパク質の総体のプロテオーム(proteome)、表現型の総体のフェノーム(phenome)までのすべてを網羅する学問をオミックス研究と呼ぶ。
  4. 国際FANTOMコンソーシアム
    2000年に、理研ゲノム科学総合研究センター 遺伝子構造機能研究グループ(現・オミックス基盤研究領域)が中心となって結成した。哺乳動物(マウス)の遺伝子を網羅的に機能注釈することを主眼とする国際的研究コンソーシアム共同集団(Functional ANnoTation Of Mammalian cDNA)の略称。現在は活動範囲を拡大し、遺伝子ネットワークの解明に取り組んでいる。オーストラリア、シンガポール、スウェーデン、南アフリカ、イタリア、ドイツ、ギリシャ、スイス、英国、米国などを含む全世界の15カ国から、51の研究機関などが参加している。
  5. 文部科学省ゲノムネットワークプロジェクト
    2004 年度から文部科学省(笹月健彦推進委員会主査、榊佳之実施会議議長、林﨑良英中核機関研究課題代表者、五條堀孝中核機関研究課題代表者)によって開始された。今後のポストゲノムシーケンシング研究の発展を目指して、国際レベルにある研究ポテンシャルを活用しつつ、遺伝子の発現調節機能やタンパク質等の生体分子間の相互作用の網羅的な解析に基づき、生命活動を成立させているネットワークを明らかにすることを目的とした。
  6. CAGE法
    Cap Analysis of Gene Expressionの略。理研オミックス基盤研究領域が開発した方法で、耐熱性逆転写酵素やcap-trapper法を組み合わせて、5'末端から20塩基のタグ配列を切り出し、塩基配列を決定する実験技法。この塩基配列を読み取ってゲノム配列と照らし合わせ、どの部分がコピーされているかを調べることができる。
  7. 選択的プロモーター
    遺伝子の発現のスイッチの役割をするプロモーター配列のうち、複数の遺伝子の発現を制御するものを指す。
  8. マイクロアレイ
    スライドガラス上の1遺伝子あたり数箇所の相補的な配列の結合により発現量を計測し、それを平均化することで、各遺伝子のRNA発現量を検出するための実験方法。
  9. マウスエンサイクロペディアプロジェクト
    1995年から理研が進めてきた完全長cDNA計画。マウスで実際に遺伝子として発現している全部のRNAの配列(遺伝子配列)を読むプロジェクトで、このためにRISA system(Riken Integrated Sequence Analysis System)、包括的完全長cDNAライブラリー作製などの一連の技術開発を展開してきた。
  10. FANTOM1~4の4つの段階

    FANTOM1
    遺伝子の機能注釈のルールや方法について取り決めを行い、遺伝子の機能注釈を効率的に行なうシステムを開発した。

    FANTOM2
    60,770セットのマウス完全長cDNAの塩基配列および機能注釈を行った。この活動は、世界で初めて哺乳類の完全長cDNAの標準化を行ったもので、成果論文はマウスゲノム解読の報告とともに、Nature特集号に掲載された。

    FANTOM3
    2005年、米国の科学雑誌『Science』のRNA特集号(9月2日号)に、ライフサイエンスの転機となる2報の成果を報告し、「RNA新大陸の発見」として大きな反響を与えた(2005年9月2日プレス発表)。

    FANTOM4
    FANTOM3までの活動で、分子ネットワークの要素となる遺伝子や、非タンパクコードRNA(Non-coding RNA; ncRNA)などを収集したことから、FANTOM4では、特に転写制御ネットワークの解明を目指して、2006年にスタートした。生命活動を分子レベルで明らかにすることが究極の目標。(2009年4月20日プレス発表)

  11. RNA新大陸
    多様な細胞内RNA集団の莫大(ばくだい)な可能性を示す比喩的表現。2005年9月のプレス発表で、遺伝子の定義を新たに提案した際に用いた新用語。細胞が生産するRNAに関し、今までにない大規模なスケールで調べたところ、従来100個ぐらいしか知られていなかったncRNAが、実は23,000個以上、つまり、全遺伝子の半分以上(53%)を占めているという新しい事実を示したものだった。このことは、タンパク質がゲノムにコードされている最終生理活性物質であるというこれまでの常識を覆し、予想を凌ぐトランスクリプトームの複雑さを認識させるもので、哺乳動物ゲノムの情報内容に対するこれまでの理解(「遺伝子」という領域が散在しているゲノムのイメージ)を根幹から変えてしまうものだった。
  12. 転写制御ネットワーク
    ある遺伝子から発現した転写因子が、別の転写因子遺伝子の発現を制御し、これにより発現した転写因子がさらに別の遺伝子発現を制御するという一連の相互作用。

このページのトップへ