広報活動

Print

2017年8月30日

理化学研究所

網羅的なRNAアトラスの基盤データを詳細に記述

-FANTOM5によるオープンサイエンスを加速-

理化学研究所(理研)予防医療・診断技術開発プログラムの川路英哉コーディネーター、林崎良英プログラムディレクター、ライフサイエンス技術基盤研究センター機能性ゲノム解析部門大容量データ管理技術開発ユニットの粕川雄也ユニットリーダー、トランスクリプトーム研究チームのピエロ・カルニンチチームリーダー、ゲノム情報解析チームのアリスター・フォレスト客員主管研究員らの共同研究グループは、「FANTOM5[1]」で取得したトランスクリプトーム[2]データの再利用を促進するため、データ取得のプロセスやデータの品質、取得後の計算処理結果などに関する詳細をまとめました。また、これを含むFANTOM5特集(FANTOM5 collection)の編纂を開始しました。

理研が主宰する国際コンソーシアム「FANTOM」は、ゲノムDNAから転写されるRNAの機能をカタログ化することを目的に2000年に発足しました。現在、第5期(FANTOM5:2009年~2017年)までの成果が論文やデータベースとして公開されています。FANTOM5では、ヒトとマウスを中心とした全6種類の生物を対象に、転写開始点[3]の活性情報を一塩基単位で定量するCAGE法[4]を含む全4種類の実験手法を用いてトランスクリプトームデータを取得しました。その解析結果はこれまでに、遺伝子発現制御部位のアトラス、長鎖ノンコーディングRNA(lncRNA)[5]のアトラス、短鎖ノンコーディングRNAの一種であるマイクロRNA(miRNA)[6]のアトラスとして報告しました。また、これらのアトラスやそのもととなったデータは、既にオープンデータとして世界中の研究者に広く公開されています。しかし、これまでのFANTOM5の報告はいずれもデータから得られた科学的発見を主眼とした論文であり、取得データそのものに焦点を当てたものではありませんでした。

そこで共同研究グループは、FANTOM5データを利用した知識の発見を促進するため、データ取得のプロセスやデータの品質、取得後の計算処理結果などの詳細をまとめました。また、今回の複数の報告は、Nature Publishing Groupから公開されるFANTOM5特集(FANTOM5 collection)としても編纂されます。本特集には、Nature誌やNature Biotechnology誌に掲載された多数の論文が含まれ、さらに今後公開が計画されているデータに関する報告や論文も追加されることが予定されています。 FANTOM5で取得したデータは、細胞の種類だけを考えても世界で類をみないものであることから、ライフサイエンスにおける基礎研究から医療を含む応用研究まで、幅広い方面でのさらなる活用が期待できます。

これらの研究は、米国のオンライン科学雑誌『Scientific Data』(8月29日付け)に掲載されました。また、FANTOM5特集は同日付でNature Publishing Groupのウェブサイトにおいて公開されました。

詳細はライフサイエンス技術基盤研究センターのホームページをご覧ください。

アトラスに関する論文と、そのもととなった取得データに関する報告の関係の図

図1 アトラスに関する論文と、そのもととなった取得データに関する報告の関係

FANTOM5での取得データの解析をもとに作成された「アトラス」を、論文を参照した上で第三者が再利用する流れを右側の黒矢印で、取得データそのものをデータ取得のプロセスやデータの品質、取得後の計算処理結果などに関する詳細をまとめた報告 (データディスクリプター)を参照した上で再利用する流れを左側の黒矢印で示している。

新旧リファレンスゲノム配列を基準として定量した転写開始活性の比較図

図2 新旧リファレンスゲノム配列を基準として定量した転写開始活性の比較

個々の転写開始点について、旧いリファレンスゲノムでの発現量と新しいリファレンスゲノム上での発現量を比較した。新旧ゲノム上での発現量に高い相関があることが確認できる。

補足説明

  1. FANTOMコンソーシアム

    FANTOMは理化学研究所が主宰する国際研究コンソーシアム。理研のマウスゲノム百科事典プロジェクトで収集された完全長cDNAの機能注釈(アノテーション)を行うことを目的に、理研ゲノム科学総合研究センターの林崎良英グループディレクター(現 予防医療・診断技術開発プログラム プログラムディレクター)が中心となり2000年に結成された。その成果は、iPS細胞(人工多能性幹細胞)の樹立研究など生命科学の広い分野に貢献している。5期目のプロジェクトとなるFANTOM5では、さまざまな哺乳類細胞のゲノム上の遺伝子制御部位の活性を測定し、転写状態やプロモーター活性の全容を明らかにする研究が進められた。現在のFANTOM6には20カ国、100以上の研究機関が参加し、ノンコーディングRNAの網羅的な機能解析に取り組んでいる。FANTOMは、Functional ANnoTation Of Mammalian genome の略。

  2. トランスクリプトーム

    細胞内の全DNAの塩基配列情報を指す「ゲノム」に対し、細胞内の全転写産物(全RNA)をまとめてトランスクリプトームと呼ぶ。タンパク質の設計図となるmRNAよりもそれ以外のncRNAが多く存在することが明らかになり、それらの機能解析が進められている。

  3. 転写開始点

    ゲノムDNAの塩基配列がRNAに転写される際、最初に写し取られる塩基。転写開始点の近傍は、遺伝子発現のタイミングや発現量の制御に重要な役割を持つ。

  4. CAGE法

    理研が独自に開発した手法で、耐熱性逆転写酵素やmRNAのCap構造を捕捉する技術を組み合わせて転写産物の転写開始点の塩基配列を決定する実験手法。この塩基配列を読み取ってゲノム配列と照らし合わせて、どこから転写が始まっているかを調べることができる。遺伝子の転写開始点と転写量をゲノムワイドに同定できる。CAGE法により、一塩基単位でのプロモーター情報が分かり、エンハンサー、転写因子の予測ができ、複数遺伝子の共発現ネットワークなどを解明できる。CAGEはCap Analysis Gene Expressionの略。

  5. 長鎖ノンコーディングRNA(lncRNA)

    タンパク質をコードしないノンコーディングRNAの一種。一般に、約200塩基以上のものを指す。全長にわたる保存性は高くないが、反復配列やウィルス由来の配列断片を含むものも多い。転写、翻訳、エピジェネティクスなど生体内の多様なプロセスに関与するものが知られている。

  6. マイクロRNA(miRNA)

    細胞内に存在する長さ21~23塩基程度の1本鎖RNA。数百~数千の塩基の一次転写産物から段階的に切り出されて作られる。タンパク質へは翻訳されず、標的となるmRNAの分解、翻訳抑制を通して、遺伝子機能の抑制に働く。

発表者

理化学研究所 科学技術ハブ推進本部 予防医療・診断技術開発プログラム
プログラムディレクター 林崎 良英 (はやしざき よしひで)
コーディネーター 川路 英哉 (かわじ ひでや)

理化学研究所 ライフサイエンス技術基盤研究センター
機能性ゲノム解析部門 大容量データ管理技術開発ユニット
ユニットリーダー 粕川 雄也 (かすかわ たけや)

トランスクリプトーム研究チーム
チームリーダー ピエロ・カルニンチ (Piero CARNINCI)

ゲノム情報解析チーム
客員主管研究員 アリスター・フォレスト (Alistair FORREST)

林崎良英プログラムディレクターの写真

林崎良英

川路英哉コーディネーターの写真

川路英哉

粕川雄也ユニットリーダーの写真

粕川雄也

ピエロ・カルニンチ チームリーダーの写真

ピエロ・カルニンチ

アリスター・フォレスト客員主管研究員の写真

アリスター・フォレスト

お問い合わせ先

理化学研究所 ライフサイエンス技術基盤研究センター
広報・サイエンスコミュニケーション担当 山岸 敦(やまぎし あつし)
Tel: 078-304-7138 / Fax: 078-304-7112

報道担当

理化学研究所 広報室 報道担当
Tel: 048-467-9272 / Fax: 048-462-4715
お問い合わせフォーム