広報活動

Print

2016年11月1日

理化学研究所
ミシガン州立大学

バクテリア細胞質の全原子分子動力学計算

-スーパーコンピュータ「京」で複雑な構造と運動を明らかに-

要旨

理化学研究所(理研)杉田理論分子科学研究室の杉田有治主任研究員、理論科学連携研究推進グループの優乙石研究員と米国ミシガン州立大学のマイケル・ファイグ教授らの国際共同研究グループは、バクテリア[1]細胞質[2]の全原子モデルを作成し、スーパーコンピュータ「京」[3]を用いた大規模分子動力学計算[4]によって、細胞質中での生体分子の複雑な挙動を原子レベルで解明しました。

細胞内の細胞質は、体積の約70%が水で占められています。残りの30%はリボソーム[5]などの超分子、タンパク質やRNA (核酸)などの生体高分子、アデノシン三リン酸(ATP)やアミノ酸などの代謝物、イオンで占められています。このような分子で混み合った環境(細胞内分子混雑環境)での生体分子の構造、動態、機能発現のメカニズムは、実験的にも理論的にも解明が難しく、原子・分子レベルの解像度では十分に理解されていませんでした。

今回、国際共同研究グループは、全長400ナノメートル(nm、1nmは10億分の1メートル)という世界最小のバクテリアであるマイコプラズマ・ジェニタリウム[6]の細胞質に含まれるほとんどの分子構造を原子レベルで構築(モデリング)し、世界最大級かつ最高解像度の細胞質モデルを作成しました。また、理研で開発した超並列分子動力学計算ソフトウェア「GENESIS」[7]をスーパーコンピュータ「京」上で大規模に利用することによって、細胞質モデルに含まれる原子一つひとつの動きを再現しました。さらに、計算で得られたビッグデータを詳細に解析し、細胞質中におけるタンパク質構造の安定性や、代謝物がタンパク質構造に与える影響などについて、実験的観測や理論予測では発見が困難な特徴とメカニズムを明らかにしました。

本研究を通じて得られた発見や培われた計算技法は、今後、細胞環境を考慮したより高精度の創薬プロセスの基盤としての活用が期待できます。

本研究の大部分の計算は、文部科学省HPCI戦略プログラム分野1「予測する生命科学・医療および創薬基盤」における「細胞内分子ダイナミクスのシミュレーション(課題番号:hp150233)」として「京」の計算資源を用いて行われました。

成果は、米国の科学雑誌『eLife』に掲載されるのに先立ち、オンライン版(11月1日付け)に掲載されます。

背景

細胞内の細胞質は、体積の約70%が水で占められています。残りの30%はリボソームなどの超分子、タンパク質やRNA (核酸)などの生体高分子、アデノシン三リン酸(ATP)やアミノ酸などの代謝物、イオンで占められています。このような分子で混み合った環境(細胞内分子混雑環境)で、タンパク質などの生体分子は機能しています。しかしこれまで、細胞内分子混雑環境内での生体分子の構造や機能発現のメカニズムは、実験的にも理論的にも解明が難しく、原子・分子レベルの解像度では十分に理解されていませんでした。

従来の理論は、細胞内分子混雑環境では、生体高分子が互いを空間的に押しのける効果(排除体積効果)が支配的で、コンパクトな立体構造が優位になると予測していました。しかし、他の研究グループが、生きた細胞における生体分子のNMR(核磁気共鳴)計測が可能な最新の観測手法「In-cell NMR」で観測したところ、細胞質中では、コンパクトな立体構造ではなく、むしろほどけた構造のほうが優位になるタンパク質があることが明らかになりました。

また細胞内分子混雑環境で、タンパク質がアデノシン三リン酸(ATP)やアミノ酸などのさまざまな代謝物とどのように相互作用しているか、代謝物の分布や動態がどうのようになっているかなどは、分子が小さく動きが速過ぎるなどの理由から実験が難しく、分かっていませんでした。

研究手法と成果

国際共同研究グループはまず、全長400ナノメートル(nm、1nmは10億分の1メートル)という世界最小のバクテリアであるマイコプラズマ・ジェニタリウムの細胞質に含まれるリボゾームやシャペロ二ン(GroEL)[8]などの超分子、タンパク質やRNAなどの高分子、ATPやアミノ酸などの代謝物、イオン、水分子などの全原子モデル(全ての原子座標を用いて分子構造を表したモデル)を用いて、シミュレーション可能な細胞質モデルを構築しました。構築した細胞質モデルには、約1億個の原子が含まれており、これまでに世界中で行われた生体分子系の分子動力学計算として最大級となります()。さらにこの細胞質モデルには、プロテオーム解析[9]メタボローム解析[10]によって得られた実験情報を基に代謝経路に必要なほぼすべての生体高分子および代謝物の種類と濃度が再現されています。また、各生体分子の構造は、構造ゲノム解析[11]で得られた立体構造情報を活用したホモロジーモデリング[12]によって、原子レベルで再現されました。このようにして構築したモデルは、多くの物理化学的および生化学的条件を満たす信頼性の高いものとなっています。また、この大規模モデルに加え、1,170万個の原子を含む中規模な細胞質モデル(1辺が50nmの立方体)も構築しました。

さらに、従来不可能であったこれだけ多くの原子を含む生体分子系の分子動力学計算を、理研で開発した超並列分子動力学計算ソフトウェア「GENESIS」を用いて、スーパーコンピュータ「京」の多くの計算資源(65,536個のプロセッサコアに相当する8,192台の計算機ノード)を合計数カ月間稼働させることで可能としました。現在までに約1,170万原子系、約1億原子系について、それぞれ130ナノ秒(1ナノ秒は10億分の1秒)、20ナノ秒 の原子や分子の挙動のデータが得られています。この計算時間は、タンパク質が機能する時間と比べるとはるかに短いですが、1回のシミュレーションで細胞質モデルに含まれる複数のタンパク質の座標データが同時に得られるため、これまでにないビッグデータが得られました。

得られたビッグデータを詳細に解析したところ、隣接する生体高分子との相互作用によって“タンパク質の構造が変化する過程”の詳細が明らかになりました。また、ATPやアミノ酸などの代謝物はタンパク質の表面をなぞるように拡散し、タンパク質の活性部位などでの分布状態が、試験管内のような希薄溶液環境下と比べて大きく異なることが明らかになりました。さらに、タンパク質同士の相互作用だけではなく、さまざまな代謝物による静電的な相互作用が酵素の立体構造や反応性に大きな影響を与えている可能性が示されました。

今後の期待

本研究は、個々の生体分子を対象とした従来の理論的研究を大きく発展させ、膨大な数の生体分子が高密度で共存する細胞内の分子動態解明に取り組んだものです。研究を通じて発見・解明した特徴の多くは、従来の細胞内分子混雑環境に対する理解を深めると期待できます。長期的には分子科学と細胞生物学の異なる時空間階層を統合し、生命科学の究極的な目標である「原子レベルから細胞生命現象を解明する」ことへ寄与すると考えられます。

また、本研究は創薬・医療方面への展開も期待できます。従来のコンピュータ創薬では、一般的にタンパク質と候補化合物1対1の、水中でのシミュレーションによって結合親和性解析が行われていました。しかし、細胞内のタンパク質はその他の生体高分子に近距離で取り囲まれており、化合物は標的にたどり着くまでさまざまな分子表面に捉えられます。このような競合的相互作用は、時に重大な副作用を引き起こすことがあります。細胞質の大規模シミュレーションで培ったさまざまな知見と計算技法は、多対多(多数のタンパク質と多数の化合物)による競合的相互作用と細胞環境を考慮した、次世代創薬シミュレーション法の開発に繋がると期待できます。

※国際共同研究グループ

理化学研究所
杉田理論分子科学研究室
主任研究員 杉田 有治 (すぎた ゆうじ)(生命システム研究センター分子機能シミュレーション研究チーム チームリーダー、計算科学研究機構 粒子系生物物理研究チーム チームリーダー)
研究員 森 貴治 (もり たかはる)

理論科学連携研究推進グループ (iTHES)
研究員 優 乙石 (ゆう いっせき)(杉田理論分子科学研究室 研究員)

計算科学研究機構 粒子系生物物理研究チーム
研究員(研究当時) 鄭 載運 (ジョン・ジェウン)(現杉田理論分子科学研究室 技師)
研究員(研究当時) 原田 隆平 (はらだ りゅうへい)(現筑波大学大学院数理物質科学研究科 研究員)

生命システム研究センター 分子機能シミュレーション研究チーム
研究員(研究当時) 安藤 格士 (あんどう ただし)(現東京理科大学基礎工学部電子応用工学科 講師)

米国ミシガン州立大学 生化学分子生物学科
教授 マイケル・ファイグ(Michael Feig)

原論文情報

  • Isseki Yu, Takaharu Mori, Tadashi Ando, Ryuhei Harada, Jaewoon Jung, Yuji Sugita, Michael Feig, "Biomolecular interactions modulate macromolecular structure and dynamics in atomistic model of a bacterial cytoplasm", eLife, doi: 10.7554/eLife.19274

発表者

理化学研究所
主任研究員研究室 杉田理論分子科学研究室
主任研究員 杉田 有治 (すぎた ゆうじ)

研究推進グループ 理論科学連携研究推進グループ (iTHES)
研究員 優 乙石 (ゆう いっせき)

米国ミシガン州立大学 生化学分子生物学科
教授 マイケル・ファイグ (Michael Feig) 

報道担当

理化学研究所 広報室 報道担当
Tel: 048-467-9272 / Fax: 048-462-4715
お問い合わせフォーム

産業利用に関するお問い合わせ

理化学研究所 産業連携本部 連携推進部
お問い合わせフォーム

このページのトップへ

補足説明

  1. バクテリア
    細菌または真正細菌とも呼ばれる核を持たない微生物の一群。大腸菌、枯草菌(納豆菌)、乳酸菌、サルモネラ菌などが属する。
  2. 細胞質
    細胞内の核や細胞膜、その他の細胞内小器官(小胞、ゴルジ体など)を除いた均一な部分。水分子の他にリボソーム、さまざまなタンパク質やRNA、代謝物、イオンが含まれる。
  3. スーパーコンピュータ「京」
    文部科学省が推進する「革新的ハイパフォーマンス・コンピューティング・インフラ(HPCI)の構築」プログラムの中核システムとして、理研と富士通が共同で開発を行い、2012年9月に共用を開始した計算速度10ペタFLOPS級のスーパーコンピュータ。
  4. 分子動力学計算
    原子間に働く力を計算し、運動方程式を繰り返し解くことによって、分子の動きをつぶさに追跡する方法。
  5. リボソーム
    全て生物の細胞に存在するタンパク質合成を担う複合体。リボソーム内では、メッセンジャーRNA(mRNA)の遺伝情報が読み取られてタンパク質への翻訳が行われる。大小二つのサブユニットから成り、リボソームタンパク質とリボソームRNAから構成される。
  6. マイコプラズマ・ジェニタリウム
    Mycoplasma Genitalium。全長約400nmの世界最小のバクテリア。約500個の遺伝子を持ち、細胞内化学反応ネットワークの全容が実験的に解明されている。
  7. 超並列分子動力学計算ソフトウェア「GENESIS」
    GENESIS は「京」などのスーパーコンピュータでの超大規模並列化を想定して開発されたソフトウェア。数十万個のCPUを同時に用いる並列計算を行っても十分な性能を発揮できる。GENESISホームページ
  8. シャペロ二ン(GroEL)
    タンパク質は正しく折り畳まれる(フォールディング)ことで立体構造をとり、正常に機能する。フォールディングを助ける一群のタンパク質をシャペロンと呼ぶ。熱ショックなどで誘導され、タンパク質の凝集・分解を防ぎ、活性制御に関与する。シャペロニンはすべての細胞に必須の分子シャペロンの代表で、GroELはそのうちの一つ。GroELはバクテリアのシャペロ二ンで、数百のタンパク質のフォールディングを助けているといわれている。
  9. プロテオーム解析
    プロテオームとは、ある生物の系(組織、生物体、細胞など)において存在しているタンパク質の総体のこと。ある研究系でその差をみるとき(例えば正常細胞とがん細胞)に、ある特異的なタンパク質の挙動に注目するのではなく、タンパク質の総体の変化を解析することをプロテオーム解析と呼ぶ。
  10. メタボローム解析
    計測可能な代謝産物群の一斉解析法。
  11. 構造ゲノム解析
    生体内の全タンパク質の立体構造を解析することによって、立体構造と機能の関係を明らかにし、ミクロな視点から生体反応や生命現象を理解しようとする手法。
  12. ホモロジーモデリング
    アミノ酸配列に相同性(生物学的に意味のある類似性)のあるタンパク質で、立体構造が分かっているものを鋳型として、構造が未知のタンパク質の立体構造をコンピュータで予測する手法。ほかの予測法と比較して、予測精度や計算時間の面で優れており、構造データベースが充実するに従って予測可能なタンパク質数が加速度的に増加している。

このページのトップへ

マイコプラズマ・ジェニタリウムの模式図と細胞質モデルの図

図 マイコプラズマ・ジェニタリウムの模式図と細胞質モデル

A:マイコプラズマ・ジェニタリウムの模式図。全長は約400nm。DNA(赤)と細胞膜(緑)を除いた部分が細胞質。このバクテリアには細胞壁や核膜は存在しない。

B:マイコプラズマ・ジェニタリウムの細胞質モデル。細胞全体の体積の10%程度をカバーしており、各生体高分子を異なる色で表示している。点線で囲まれた複合体は、それぞれリボソーム(紫)とシャペロニンのGroEL(黄)。一辺が100nmの立方体に水分子を含め約1億個の原子で構成されている。

C:細胞質モデルの一部(一辺が約25 nm)を拡大表示したもの。タンパク質などの生体高分子(リボンで示されている)の他に、ATPやアミノ酸などの代謝物、イオン、水分子も全て原子レベルでモデリングされている。

このページのトップへ