創薬・医療技術基盤プログラム

創薬分子設計基盤ユニット

最新モデリング理論と統計理論を駆使した高精度インシリコスクリーニング
高精度なインシリコスクリーニング技術

 新しい創薬シーズの探索には、タンパク質の立体構造に基づく薬物設計(SBDD)が有用ですが、従来のドッキングでは、タンパク質の構造の自由度を考慮したりドッキング条件の検討を充分に行うことなく、本番のインシリコスクリーニングを行うために、特に難しい標的の場合には失敗に終わる場合もあります。創薬分子設計基盤ユニットでは、標的タンパク質の立体構造と既知阻害剤情報を最大限活かした高精度なインシリコスクリーニングのシステム(Knowledge-Based Docking Screening, KBDS、下図)を構築しています。

ワークフロー

図1 立体構造・既知阻害剤情報を最大限活用したKnowledge-Based Docking Screeningワークフロー

 KBDSは、k-PALLASとk-MUSESの2つのシステムによって構成されています。k-PALLASは、半自動的なドッキング条件の最適化システムであり、タンパク質の構造バリエーションや溶媒分子の有無など、様々な条件をインプットすると、多様なリガンドのドッキングに適したタンパク質構造セットを選び出します。選び出した最適条件を用いてドッキングすることによってドッキングの効率を向上させ、大失敗を回避することができます。以下の図は、4種類のターゲットに対してk-PALLASを適用した結果ですが、k-PALLAS によって選び出した最適条件(Best Condition)では、1% Enrichment Factor(スコア上位1%における活性化合物数がランダム選択に比べて何倍上昇するかを表す)が、平均的な条件に比べて大きく向上していることがわかります。

高精度インシリコクスリーニングの検証結果

図2 k-PALLAS による高精度インシリコスクリーニングの検証結果

 k-PALLASによって選択した化合物から、最終的にアッセイするさらに少数の化合物を絞り込むために、タンパク質-リガンド間相互作用を原子単位で記述する新規パラメータ(aPLIED)を用いて活性化合物と不活性化合物(検証時は囮で代用します)を判別する機械学習予測システム(k-MUSES)を開発しました。このk-MUSESシステムは、既知の活性化合物と囮化合物をドッキングさせ、活性化合物と囮化合物の相互作用パターンのわずかな違いを統計解析によって検出することを可能とします。

k-MUSESのしくみ

図3 相互作用パターンによる機械学習活性判別システムk-MUSESのしくみ

 以下に5種類のターゲットにおいて、k-MUSESを用いた活性判別の効率が、市販のドッキングスコアに比べてどの程度向上しているかを示しました。図はROC plotと呼び、スコア上位から並べた場合に、不活性化合物を何個選択する間(横軸)に何個の真の活性化合物を選択できるか(縦軸)を示します。折れ線グラフが左上に近づくほど精度が高いことを示します。創薬分子設計基盤ユニットにおけるaPLIEDと呼ばれる新しい相互作用記述子(パラメータ)とSupport Vector Machineによる機械学習予測モデルは、市販のドッキングスコア(GLIDE score)や文献公知の記述子(PLIF)使った場合に比べて精度が大きく向上していることがわかります。以上ご紹介したk-PALLASとk-MUSESは、創薬研究の進展とともに増大するX 線構造情報、既知阻害剤情報(構造活性相関情報)を随時活用することができ、創薬の現場で有用な技術です。

k-MUSeSによる活性判別精度の向上

図4. k-MUSESによる活性判別精度の向上

ADMET 予測技術

 創薬研究においては、ターゲットへの活性だけではなく薬物動態(ADME)と毒性(Tox)のプロファイルを向上させることが必須であり、多くの場合ターゲットに対する活性を獲得するよりも何倍も困難な作業であるために、創薬研究初期の律速段階となっています。創薬分子設計基盤ユニットでは、ADMETのデータからSupport Vector Machine, Random Forestなどの最新の統計判別理論を用いて機械学習を行い、判別予測モデルを作成します。得られた予測モデルを活用して、ドッキングなどと併用しながら、創薬シーズを最適化するための設計を行います。

図

お問い合わせ