要旨
理化学研究所(理研)環境資源科学研究センター環境代謝分析研究チームの菊地淳チームリーダー、坪井裕理テクニカルスタッフⅠと、バイオリソースセンター疾患モデル評価研究開発チームの野田哲生チームリーダー、茂木浩未開発研究員らの共同研究チーム※は新たな代謝バイオマーカー[1]探索法を開発しました。
ヒトをはじめとするさまざまな生物の「健康」は、代謝バランスの恒常性の維持によって保たれています。近年、こうしたエネルギー代謝を含む生体反応の全体像を把握するメタボノミクス[2]は生体内にとどまらず生態学、環境科学にまで利用されています。メタボノミクスが扱う膨大な代謝データの中から代謝バランスの恒常性を客観的に評価するには、その膨大なデータを解析し、最適な代謝バイオマーカーを探索する技術が不可欠です。この解析には従来、多変量解析[3]が有効とされていました。しかし、多変量解析では事前にコンポーネント数を設定[4]する必要があります。この設定を間違えると正しい結果が得られませんが、数多く提案されているコンポーネント数の決定方法のうち、現状では決定的なものはありません。
共同研究チームは、繰り返し最小二乗法・多変量波形分解法(MCR-ALS法)[5]に着目し、「コンポーネント数を決めないと解析できない」という考えから離れ、事前にコンポーネント数を設定することなく信頼性のあるコンポーネントを決定する「クラスター支援MCR-ALS法(Cluster-aided MCR-ALS法)」を開発しました。濃度が分かっている物質の混合液のNMR[6]データを使って検証した結果、開発した方法が実用に耐えることを確認しました。さらに、高脂肪食を与えたマウスや加齢マウスの尿・糞のNMRデータを解析した結果、従来法と比べて高精度であり代謝変動を示す物質数が増えることや、これまでに報告されていた知見と、より良く対応することが分かりました。
クラスター支援MCR-ALS法は、情報量にかかわらず、信頼性のあるコンポーネントを選び出すことができます。したがって、情報量の少ない、わずかな変化しか持たない病気の発症シグナルから代謝バイオマーカーを見つけることが可能になります。また、生物の健康という曖昧な情報を数値化し評価することが可能になるため、体重や栄養といった日常的に記録できるデータや、病院での診断情報などと統合・解析することで、社会基盤・生活全体を見直しQOLの向上に貢献することが期待できます。
本研究成果は、国際科学雑誌『Scientific Reports』オンライン版(11月4日付け:日本時間11月4日)に掲載されます。
※共同研究チーム
理化学研究所
環境資源科学研究センター 環境代謝分析研究チーム
チームリーダー 菊地 淳(きくち じゅん)
テクニカルスタッフⅠ 坪井 裕理(つぼい ゆうり)
バイオリソース研究センター 疾患モデル評価研究開発チーム
チームリーダー 野田 哲生(のだ てつお)
開発研究員 茂木 浩未(もてぎ ひろみ)(研究当時)
開発研究員 美野輪 治(みのわ おさむ)
開発研究員 井上 麻紀(いのうえ まき)
開発技師 土岐 秀明(とき ひであき)
テクニカルスタッフⅡ 佐賀 彩子(さが あやこ)
テクニカルスタッフⅡ 加賀美 智子(かがみ ともこ)
背景
ヒトをはじめとするさまざまな生物の健康は、バランスのとれた栄養摂取と調和的な生育環境の整備による代謝バランスの恒常性の維持によって保たれます。近年、こうした生命の維持に不可欠な代謝バランスの恒常性を評価する手法として、エネルギー代謝を含む生体反応の全体像を俯瞰するメタボノミクスが利用されています。例えば、ヒトや家畜の場合、尿や糞といった非侵襲的に採取できる試料を用いて、生活習慣病を事前に予防することが期待できます(図1)。このためには、メタボノミクスによって得られた膨大なデータを処理する技術が不可欠です。一度に多くのデータを解析する手法として、多変量解析があります。しかし、多変量解析の多くは、シグナル等の条件による変化など、対象とする全てのデータとその条件による変化を適切に説明できる要素である「コンポーネント」の数をあらかじめ決めておかないと計算ができないという欠点があります。コンポーネント数の決定は結果に大きく影響し、コンポーネント数が少ないと、意味のある情報を失ってしまい、逆にコンポーネント数を多く設定してしまうと、不要な情報が混入してしまうことになります。これまでにさまざまなコンポーネント数決定法が提案されてきましたが、方法によって結果が異なってしまい、現状では決定的なものはありませんでした。
共同研究チームは当初、高脂肪食を与えたマウスや加齢マウスの尿・糞を採取し、NMRによるメタボノミクスを行って生活習慣や加齢によって変動する代謝バイオマーカーを探索する研究を行っていましたが、上述の問題に直面し、データ解析手法の再検討を迫られました。そこで、「コンポーネント数を決めないと解析できない」という考えから離れて新しい発想を取り入れることで、コンポーネント数決定の必要がなく、かつ信頼性のあるコンポーネントを決めることを試みました。
研究手法と成果
共同研究チームは、多変量解析手法の1つ、繰り返し最小二乗法・多変量波形分解法(MCR-ALS法)を用いてコンポーネント数と計算結果の関係を調べました。その結果、コンポーネント数にかかわらず再現するコンポーネントと、そうでないコンポーネントがあることが分かりました。そこで、コンポーネント数を変化させてMCR-ALS計算を繰り返し行い、計算結果のうち類似したものをまとめる(クラスタリングする)ことを考えました。得られたクラスターのうち、大きなクラスターは何度も再現したクラスターを意味します。これはコンポーネント数にかかわらず再現する信頼性の高いコンポーネントであることを示します。一方で、クラスターを形成しない、もしくは小さなクラスターを形成するコンポーネントは信頼性が低いコンポーネントであると考えられます。選ばれたコンポーネントが持つ代謝物群の波形情報と濃度情報から物質とその濃度を推定します(図2)。
この方法が実用的かどうかを検証するために、濃度が分かっている物質の混合溶液(3~20の物質)を作製し、NMRで計測したデータを解析しました。従来の方法と、新たに考案した方法とを比較したところ、従来法では混合溶液の違いを特徴付ける物質を6種しか検出できませんでしたが、新たな方法ではさらに7つ、合計13物質で試料間の差異を示すことができました。
次に、この方法を、マウスの尿および糞のNMRデータ解析に適用しました。マウスの3つの系統(B6=C57BL/6JC、C3=C3H/HeJ、D2=DBA/2J)雌雄各5個体(1群のみ4個体)について、通常食を与えた群、高脂肪食を与えた群と、通常食で高齢マウスの群の3群に分けました。この合計89個体について尿と糞を採取し、1H-NMR[6]法により解析を行いました。従来法では、尿・糞ともにコンポーネント数は6でしたが、新たな方法では尿で21、糞で35のコンポーネントが選ばれました。これは、従来法よりも多くの物質の変化が、一定の信頼性をもって捉えられたことを意味します。たとえば尿中のタウリン[7]は高脂肪食により低下することが知られています。また加齢によっても低下します。従来法ではタウリンに相当するコンポーネントは見つかりませんでしたが、新たな方法では、タウリンのシグナル(3.26ppm、3.43ppm)をもち、高脂肪食および加齢で低下する傾向を持ったコンポーネントが見つかりました(図3上)。また、尿中トリメチルアミンーNオキシド(TMAO)[8]は、高脂肪食を与えたメスで高値になります。従来法の結果からは、この現象がB6系統のメスには見られず、一見、系統間差が見られましたが、新たな方法では、B6系統のメスが高値になっているコンポーネントも見つかりました(図3下)。何らかの理由でB6メスだけTMAOのシグナルがわずかに変化し(3.30ppmと3.26ppmの違い)、別のコンポーネントとして現れたと考えられます。このコンポーネントは従来法では見られませんでした。従来法では系統間差があるという間違った結果を生んでしまうことになりますが、新たな方法では、もう1つのコンポーネントを考え合わせることで、系統間差がないことが分かりました。
これらの結果から、今回考案した方法は、従来法よりも高精度であることから変動を示す物質数が増え、しかも一定の信頼性を持っている点で極めて優れている方法であるといえます。研究チームはこの方法をクラスター支援MCR-ALS法(Cluster-aided MCR-ALS法)と名づけました。
今後の期待
クラスター支援MCR-ALS法は、情報量にかかわらず、信頼性のあるコンポーネントを選び出すことができます。したがって、情報量の少ない、わずかな変化しか持たない病気の発症シグナルから代謝バイオマーカーを見けることが可能になります。また、現時点では一部手作業で計算しているため解析に時間や労力要しますが、将来的にはソフトウェア化し多くの研究者が簡単に使用できるようにしたいと考えています。
古来より「大きな便り」や「小さな便り」と称されてきた糞便や尿は、医学では検診時の重要試料であり、また理想的なリサイクル社会とされている江戸時代では貴重な肥料源であったと言われています。クラスター支援MCR-ALS法によって排泄物からのシグナルを紐解くことで、ヒトや環境の恒常的・持続的生活を維持する方向性を見出せるかもしれません。既にモデル動物からは酢酸注1)、酪酸注2)、ピメリン酸注3)、さらに野生動物からは必須アミノ酸群注4)といった、動物腸内の共生微生物叢から産生される有用物質の変動も、メタボノミクス手法で捉えることに成功しています。また、開発した手法により、ヒトをはじめとするさまざまな生物が持つ健康という曖昧な情報を数値化し、評価することが可能になります。これらのデータと、病院での診断/治療/検査履歴の情報や体重/食事/運動といった日常的に記録できるデータなどと統合・解析して、社会基盤・生活全体を見直しQOLの向上に貢献することが期待できます。クラスター支援MCR-ALS法は、高感度かつ信頼性をもったデータ解析のための基礎技術として疾患発症を未然に防ぐための健康管理に役立つといえます。
注1)2011年1月27日プレスリリース「ビフィズス菌の作る酢酸がO157感染を抑止することを発見」
注2)2013年1月14日プレスリリース「腸内細菌が作る酪酸が制御性T細胞への分化誘導のカギ」
注3)2015年9月1日プレスリリース「ビフィズス菌BB536による腸内細菌を介した生理機能の仕組みの一旦を解明」
注4)2014年7月9日プレス発表「シロアリの後腸に共生バクテリアによる新たな代謝経路を発見」
原論文情報
- Hiromi Motegi, Yuuri Tsuboi, Ayako Saga, Tomoko Kagami, Maki Inoue, Hideaki Toki, Osamu Minowa, Tetsuo Noda and Jun Kikuchi, "Identification of Reliable Components in Multivariate Curve Resolution-Alternating Least Squares (MCR-ALS): a Data-Driven Approach across Metabolic Processes", Scientific Reports, doi: 10.1038/srep15710
発表者
理化学研究所
環境資源科学研究センター 環境代謝分析研究チーム
チームリーダー 菊地 淳(きくち じゅん)
テクニカルスタッフⅠ 坪井 裕理(つぼい ゆうり)
バイオリソースセンター 疾患モデル評価研究開発チーム
チームリーダー 野田 哲生(のだ てつお)
開発研究員 茂木 浩未(もてぎ ひろみ)(研究当時)
報道担当
理化学研究所 広報室 報道担当Tel: 048-467-9272 / Fax: 048-462-4715
補足説明
- 1.代謝バイオマーカー
生命はエネルギー代謝等の恒常性を維持する特徴を有するが、栄養摂取や生育環境の調和が乱れると、恒常性破綻が起こる。こうした代謝バランスの乱れを特徴付ける物質を代謝バイオマーカーという。ヒトの場合、栄養価が偏り運動不足が続くと肥満/糖尿/動脈硬化といった生活習慣病の兆候が現われる。その兆候をいち早く示す物質を特定することで、生活習慣病を事前予防し、健康維持に貢献することが期待されている。 - 2.メタボノミクス
栄養摂取や生育環境変化といった、生命の代謝バランス変化の応答が起こることを体液・排泄物といった代謝混合物のスペクトル変化から特徴付ける学問分野のこと。代謝混合物のスペクトルは複数の変数から構成される多変量データを用いるため、後述の多変量解析を駆使することが重要である。一般に用いられる“メタボロミクス“という用語が検出代謝物数の上下を重視する傾向にあるのに対し、メタボノミクスでは代謝バランスの変動を捉えることが出来、なおかつ変動さえ捉えられれば、その特徴を示すバイオマーカーをいち早く絞りこむことに注力されている。 - 3.多変量解析
複数の変数からなる多変量データを統計的に扱う手法。大量のデータから主要因子を取り出すデータマイニングにおいてよく使われる解析法で、代表的なものとして主成分分析(PCA)、部分最小二乗判別分析(PLS-DA)、独立成分分析(ICA)、非負値行列因子分解(NMF)、多変量波形分解(MCR)が挙げられる。PLS-DAは、正常と異常といった2つのグループ間の差が最大になるようにモデルを考える。そのときに大きく関与する変数に相当する物質がバイオマーカー候補となる。ICAは、データをおのおの独立な成分の和として考え、その成分を算出する方法。NMFは、成分の計算の際、結果が非負(正の値)になるように計算すること。物質の濃度は負になることはないので、他の手法と比べて、より生体試料の解析に向いている。MCRは、NMRや遠赤外分光法などの波形(スペクトル)データの解析を前提として開発されたもの。 - 4.コンポーネント数の設定
因子数決定とも呼ばれる。データをいくつの成分(コンポーネント/因子)に分解するかを決める。多くの解析手法で、前もってコンポーネント数をきめておき、解析時にその数を設定して計算する。横軸にコンポーネント数、縦軸に情報量(固有値)をとったグラフ(スクリープロット)を作成し、変化がなだらかになる直前の数をコンポーネント数(因子数)とする方法が多く採用されているが、他にもさまざまな方法(カイザー基準、平行分析、CNG法、Multiple regression法、Cross-validation法)がある。現在のところ、絶対的に正しいとされている方法はない。 - 5.繰り返し最小二乗法・多変量波形分解法(MCR-ALS法)
MCR法の1つで、コンポーネントを計算する際に最小二乗法を繰り返して用いることで最適化を行う。MCRとはMultivariate Curve Resolution、ALSとはAlternating Least Squaresの略。 - 6.NMR(核磁気共鳴)法、1H-NMR
原子や分子は、静磁場中で外部からエネルギーを与えると、構造に特徴的なエネルギーを吸収、放出する。エネルギーの強さ(周波数)を変えながら吸収・放出を計測することで物質に固有の波形(スペクトル)が得られる。混合物の場合は個々の物質由来のスペクトルが足しあわされた波形が得られるので、スペクトルを調べることでどんな物質が混合されているかを知ることができる。試料を何らかの方法でイオン化しなければならない質量分析法とくらべ、NMRでは尿や糞便などの生体試料が最小限の前処理で、イオン化する必要なくそのまま計測できる特徴を有する。1H-NMRとは水素原子を対象としたNMR法のこと。 - 7.タウリン
生体内では胆汁酸と結合し、コレステロール排出に関与している。主に、アミノ酸の1種であるシステインから合成される。 - 8.トリメチルアミンーNオキシド(TMAO)
食物由来の代謝物。食物中に含まれるレシチン(コリン)が腸内細菌によりトリメチルアミンに変換される。トリメチルアミンは肝臓でFMO酵素(フラビンモノオキシゲナーゼ)によりトリメチルアミンーNオキシドに変換され、尿に排出される。TMAOとはTrimethylamine N-Oxideの略。
図1 代謝バランスの破綻を検出する方法
植物なら光合成や土壌肥料、動物なら摂取栄養や運動が適度に保たれることで、生命は恒常性を維持でき、生体内の代謝物はある一定の範囲内で変動する。しかし、例えばヒトなら、栄養過多や運動不足で一部の代謝物が量的に変化し、正常な範囲を超えていく。メタボノミクス技術は、このような代謝バイオマーカーの発見に有効な技術。発症時だけでなく、発症する前に変化する代謝バイオマーカーを見つけることができれば、これを発症前診断マーカーとして用い、発症を予測し、予防することも可能になる。
図2 クラスター支援MCR-ALSM法の原理
コンポーネント数を変化させて繰り返しMCR-ALS計算を行う。その結果、多数のコンポーネントが得られる。再現性の高いコンポーネントを選ぶためコンポーネントデータをクラスター化する。大きなクラスター(図中のクラスターA、B、C)は、信頼性があるコンポーネントを示し、これらのコンポーネントから代謝物群の濃度情報、波形情報をとりだします。一方で、小さいクラスターや、クラスターを形成しないコンポーネントは信頼性がないとして、解析から除外する。
図3 尿中タウリン、尿中トリメチルアミンーNオキシドの変化
尿中タウリンは、高脂肪食、加齢で低下することが知られている。新しい方法ではタウリンを示す3.43および3.26ppmのシグナルを持つコンポーネントが得られた(図上)。濃度情報では、高脂肪食、加齢で低下していて、これまでの知見と矛盾しない結果となった。しかし、同様のコンポーネントは従来法では見られなかった。トリメチルアミンーNオキシドに対応する3.30ppmを示すコンポーネントは従来法、新しい方法の両方で見られた(図下)。高脂肪食を与えたメスで高値だったが、B6系統のマウスは高値になっていなかった。新しい方法では、さらにもう1つのコンポーネントが見られた。B6系統のメスで、トリメチルアミンーNオキシドのシグナルがわずかに変化したために、別のコンポーネントとして現れたと考えられる。従来法では、このコンポーネントが現れなかった。