広報活動

Print

2012年2月13日

独立行政法人 理化学研究所

次世代シーケンサーのデータ解析精度を向上させる新手法を開発

-疾患を未然に防ぐ先制医療、バイオマス資源開発などへの応用に期待-

複数個のmRNA-seqデータに対してポジショナル相関解析を適用した結果

分子生物学では、RNAはDNAの持つ情報を写し取ってタンパク質を作るために働く、単なる“つなぎ役” というのが常識とされた時代がありました。しかし、最近ではRNAにも様々な種類があり、果たす役割も多様なことが分かってきて、「DNAは情報を保存しているだけ。タンパク質は命令にしたがって働くだけ。RNAこそがそれらをコントロールする存在だ」と、にわかに注目されています。細胞内にはDNAを転写したRNAのセットである「トランスクリプトーム」と呼ばれる集合体がありますが、それを正確に捉えることでRNAの構造や動き方を理解しようという試みが各国の研究機関で行われています。

トランスクリプトームの解析で大きな力を発揮しているのが、塩基配列を解読する装置であるシーケンサーです。とくに次世代シーケンサーと呼ばれる装置の機能向上は著しく、データ量の大規模化や処理の効率化が図られています。ただ、観察できるRNA分子の長さが100塩基程度と限られているため、断片化されたRNAの情報しか得られません。このため、RNA分子の配列情報を正確に再構築して全長RNAを得るための処理が必要となります。

生命情報基盤研究部門の研究者達は、タンパク質情報をもつmRNA(メッセンジャーRNA)の分子配列を解読する実験法「mRNA-seq」で得られたデータを使い、ゲノム上の2点間のRNAの転写活性の相関を解析する「ポジショナル相関解析法」を考案し、これを実行するプログラムとして「ARTADE2」を開発しました。すでにRNAの構造が分かっているシロイヌナズナという植物でARTADE2 を用いてプログラムの精度を検証した結果、全長RNAの塩基配列情報の再構築を92.6%という高いカバー率で実現できました。同プログラムは複数サンプルで転写の相関情報を利用するため、サンプル数が多くなるにつれて解析精度が増すという特徴を持ちます。

この手法を応用すれば、健常者と疾患者のRNAを比較して疾患のメカニズムを解明し、疾患を未然に防ぐ先制医療に役立てることや、バイオマス資源の候補とされる植物の細胞内RNAの構造や動きを理解することも可能になります。なお、同プログラムは生命情報基盤研究部門のwebページに掲載され、2月13日からダウンロードできます。

理化学研究所
生命情報基盤研究部門
部門長 豊田 哲郎(とよだ てつろう)
Tel: 045-503-9610 / Fax: 045-503-9553