2013年6月21日
理化学研究所
植物のDNAをデザインするウェブアプリ「PromoterCAD」を開発
-効率的なバイオマス生産に貢献できるツールとして期待-
ポイント
- PromoterCADは遺伝子発現を制御する人工プロモーターを設計できる世界初のアプリ
- ユーザーインターフェースの整備により誰でも簡単にプロモーターデザインを実現
- 植物や動物への拡張にも対応し、多様な生物種の合成生物学研究への展開も期待
要旨
理化学研究所(理研、野依良治理事長)は、既存のマイクロアレイ[1]などの生命科学データベースを活用して、植物の遺伝子発現を制御するDNA配列(プロモーター)を人工的に設計するウェブアプリ「PromoterCAD(プロモーターキャド)」を開発しました。これは、理研環境資源科学研究センター(篠崎一雄センター長)バイオマス工学連携部門 合成ゲノミクス研究チームの松井南チームリーダーらと理研情報基盤センター(姫野龍太郎センター長)統合データベース特別ユニットの豊田哲郎ユニットリーダーらの研究グループによる成果です。
近年、植物や微生物が持つ遺伝子が発現するタイミングや場所(組織・器官)を操作して効率的にバイオマス(バイオ燃料、バイオポリマー、バイオセルロースなど)を生産する技術開発が進められています。そのため、特定の遺伝子発現を高めるようにDNA配列を設計するアプリが数多く開発され、設計部品となるプロモーター、タンパク質配列、シグナル配列などの標準的なパーツの整備が進められています。しかし、合成生物学研究の多くは微生物やウィルスを対象としており、植物や動物などの高等生物は未開拓のままで、標準的なパーツの整備が遅れています。また、合成生物学で用いられるアプリの多くは標準的なパーツ以外のデータを共有できないため利用できるデータが限られており、これまで実質的に有効なアプリがありませんでした。
遺伝情報が含まれるDNA配列(遺伝子)から遺伝子産物とよばれるRNAやタンパク質が合成され、機能することを遺伝子発現といいます。遺伝子産物の合成は、プロモーターと呼ばれる特殊なDNA配列と、転写因子と呼ばれるタンパク質群の相互作用によって制御されています。なかでもプロモーターの役割は重要で、生物の組織や成長段階の時期などの条件によって、遺伝子発現のタイミングを調節しています。
研究グループは、モデル植物であるシロイヌナズナにおいて遺伝子発現する組織やタイミングの調節を可能にする人工プロモーターの設計ができるアプリとして「PromoterCAD」を開発しました。PromoterCADは、プログラミングなどの専門知識がなくても容易に人工プロモーターを設計できるようなユーザーインターフェースを整備し、誰でも簡単に扱うことができます。また、利用者が自由にデータを追加したり、アプリケーションをカスタマイズすることもできます。
今後、データベースをさらに整備し、植物だけでなく動物にもDNA設計の対象を拡大することができれば、PromoterCADをより汎用性の高い人工プロモーター設計アプリに発展させることができます。これにより、環境面だけでなく医療面でも合成生物学の応用が可能になると期待できます。
本研究成果は、科学技術振興機構 ライフサイエンスデータベース統合推進事業の一環として行われ、英国の科学雑誌『Nucleic Acids Research』(7月1日号)に掲載されるに先立ち、オンライン版(6月21日付け:日本時間6月22日)に掲載されます。
なお、PromoterCADのアプリは、PromoterCADの公式Webサイトから利用可能です。
背景
生物の体を構成する組織・器官の構造や機能は、DNA配列から合成される遺伝子産物(RNAやタンパク質)によって決められています。遺伝子産物は、遺伝子からRNAに写し取られたり(転写)、RNAからタンパク質へ変換(翻訳)されたりして合成されます。このことを遺伝子発現と呼びます。遺伝子発現の工程の1つである転写において、重要な役割を担うのはプロモーターです。プロモーターとは、遺伝子が位置する上流領域にある特定のDNA配列で、この領域に転写を正常に制御するためのさまざまなタンパク質(RNA合成酵素のRNAポリメラーゼや転写因子)が結合します。これらが複雑に相互作用することで転写の開始が調節されるので、プロモーターは転写に不可欠な配列と考えられています。プロモーターには、モチーフ配列と呼ばれる特徴的な配列が含まれています。また、転写因子には、さまざまな種類があり、なかでも特定の組織だけに働く転写因子(組織特異的転写因子)がモチーフ配列に結合することで、特定の組織や時期に合わせて遺伝子発現を調節することも分かっています。過去の研究の蓄積から、さまざまなタイプのモチーフ配列が同定、予測されており、既存のプロモーターに自由に組み入れることができれば、人工的に有用なプロモーターを設計することができます。
このように生物や細胞に含まれる分子やシステムを再現し、自然界には存在していない分子やシステムを人工的に作りだして、これらの利用や応用を研究する分野を合成生物学と呼びます。近年、応用研究の1つとして遺伝子が発現するタイミングや場所を自在に制御した植物や微生物を用いて、バイオマス(バイオ燃料、バイオポリマー、バイオセルロース)を効率的に工業レベルで生産することを目指した開発が進められています。特にバイオマス生産に関わる酵素タンパク質群が注目され、これらのタンパク質をコードする遺伝子の発現を調節できれば、目的のバイオマスを効率的に生産できると考えられます。現在までにDNA配列設計用のアプリが多く開発され、設計部品となるプロモーター、タンパク質配列、シグナル配列などの標準的なパーツの整備が進められています。これまで微生物やウィルスを対象とした研究が盛んに行われてきましたが、植物や動物などの高等生物の研究は未開拓であり、標準的なパーツの整備が遅れています。また、合成生物学で用いられるアプリの多くは標準的なパーツ以外のデータを利用することができないため、利用できるデータが限られており、これまでプロモーターを自由にデザインすることはできませんでした。
そこで、研究グループは、モデル植物であるシロイヌナズナにおいて遺伝子を発現する組織やタイミングの調節を可能にする人工プロモーターを設計できるようアプリの開発を試みました。
研究手法と成果
研究グループは、利用者の目的に応じたプロモーター設計ができるように、データ登録システム「LinkData.org(リンクデータ)」上に、シロイヌナズナのプロモーター設計のパーツとなるデータベースを構築しました。具体的には、シロイヌナズナのプロモーターのモチーフ配列が登録された既存のデータベース2種類「ATTED-II(アッテド-ツー)」、「PPDB(ピーピーディービー)」と、既存のマイクロアレイによる網羅的な遺伝子発現データベース2種類「AtGenExpress(アットジェンエクスプレス)」、「DIURNAL(ダイアーナル)」を組み合わせて計4種類のデータベースを構築し、LinkData上に登録しました。また、プログラミングの専門知識がなくても容易にプロモーター設計を行えるように、プルダウンメニューやボタン操作・グラフ表示に従ってアプリを実行できるユーザーインターフェースを用意しました。それらを組み合わせた結果、シロイヌナズナにおいて遺伝子発現する組織やタイミングの調節を可能にする人工プロモーター設計ウェブアプリ「PromoterCAD」を完成させました(図1)。
PromoterCADは、天然のプロモーターで同定されているモチーフ配列を合成プロモーターに導入する戦略を用いて、人工プロモーター設計ができます(図2)。利用者の設定した遺伝子発現条件に応じて、関連の強いと予想されるモチーフ配列のデータを表示し、人工プロモーター設計の素材として選択できる機能を提供しています。
特に格納されているマイクロアレイデータは、21,000個の遺伝子について20種類の慨日条件と79種類の成長条件において計測された合計142万を収録しています。このデータを利用してモチーフ配列を選択するために2つのツールを用意しました。1つは、特定の組織や時期によって最大・最小の発現レベルを示す遺伝子を見つけ出し、その遺伝子が持つモチーフ配列を提示するツール「MotifExpress(モチーフ エクスプレス)」です(図3)。もう1つは、指定した条件において、慨日振動の振幅が最大となる遺伝子を見つけ出し、その遺伝子が持つモチーフ配列を提示するツール「MotifCircadian(モチーフ サーカディアン)」です(図4)。いずれも利用者は簡単、迅速に適切なモチーフ配列を取得することができます。また、利用者が自由にデータを追加したり、アプリをカスタマイズしたりできます。このような特徴を併せ持つ合成生物学ウェブアプリケーションの開発は、世界初の試みです。
今後の期待
研究グループは今後、果実を形成する植物であるトマトや哺乳類のモデル動物であるマウスのデータベースなどを整備してアプリに追加し、PromoterCADをより汎用性の高いプロモーター設計アプリに発展させていきます。
植物だけでなく動物にもDNA設計の対象を拡大できれば、環境面だけでなく医療面でも合成生物学を応用することが可能になると期待できます。
原論文情報
- Robert Sidney Cox III, Koro Nishikata, Sayoko Shimoyama, Yuko Yoshida, Minami Matsui, Yuko Makita and Tetsuro Toyoda. "PromoterCAD: data-driven design of plant regulatory DNA". Nucleic Acids Research, 2013, doi:10.1093/nar/gkt518
発表者
理化学研究所
環境資源科学研究センター バイオマス工学連携部門 合成ゲノミクス研究チーム
チームリーダー 松井 南(まつい みなみ)
お問い合わせ先
社会知創成事業 横断プログラム推進室
Tel: 048-462-1481 / Fax: 048-462-1220
報道担当
理化学研究所 広報室 報道担当
Tel: 048-467-9272 / Fax: 048-462-4715
補足説明
- 1.マイクロアレイ
マイクロアレイは、数千~数万の遺伝子の発現を一度に解析する実験技術の1つ。ガラス基板上に多数のDNA断片(それぞれ1つの遺伝子に対応)を固定して作る。遺伝子の発現を追跡するには、調べたい細胞からmRNA(転移RNA)を抽出してcDNA(相補DNA)に変換する。cDNAを蛍光プローブで標識して、マイクロアレイと反応させて、DNAハイブリッド形成(ガラス基板上のDNA断片とcDNAとのDNA二重鎖形成)反応にかける。反応後、マイクロアレイを洗浄し、蛍光を操作して遺伝子の発現を定量化する。
図1 「PromoterCAD」の概要
シロイヌナズナのプロモーターのモチーフ配列が登録された既存のデータベース2種類(ATTED-II, PPDB)と、既存のマイクロアレイによる網羅的な遺伝子発現データベース2種類(AtGenExpress, DIURNAL)を組合わせて、計4種類のデータベースを構築した。このデータベースをデータ登録システムLinkData上に登録し、これを読み込んでプロモーター設計を行うアプリPromoterCADをアプリ登録システムLinkDataApp上に登録した。利用者は、PromoterCADから容易に人工的にデザインしたプロモーター配列を取得できる。
図2 モチーフ配列の組合せによる人工プロモーター配列のデザイン戦略
- (A) 天然プロモーターに存在するモチーフ配列を人工プロモーター配列の同じ場所に取り入れる方法。
- (B) ゲノム配列の統計解析に基づいて、機能的に働くと予測される位置にモチーフ配列を取り入れる方法。
- (C) (A)または(B)に加えて、モチーフ配列を複数コピー取り入れる方法。
図3 「PromoterCAD」のユーザーインターフェース
(MotifExpressツールを使用している例)
図4 「PromoterCAD」のユーザーインターフェース
(MotifCircadianツールを使用している例)