広報活動

Print

2018年2月8日

理化学研究所

脳型学習で主要な信号を抽出

-雑踏の中の声を聞き分ける-

ポイント

要旨

理化学研究所(理研)脳科学総合研究センター神経適応理論研究チームの磯村拓哉基礎科学特別研究員と豊泉太郎チームリーダーの研究チームは、出力の模範となるべき教師データ[1]なしに、音声や画像などの感覚情報から主要な信号源を自動抽出する「脳型学習アルゴリズム」を開発しました。

私たちは、雑踏の中でも特定の人の声を聞き分けることができます。このような機能を達成するための工学的なノイズ除去・信号分離アルゴリズムは、話者の話し声の分離や生体信号の抽出など、広い分野で使われています。しかし、従来の工学的アルゴリズムでは計算の並列化ができず、ノイズが強い場合にノイズを除去することが難しいという問題がありました。

今回、研究チームは、並列計算でノイズ除去と信号分離を同時に実行する脳型学習アルゴリズム「EGHR-β(Error-Gated Hebbian Rule β)」を開発しました。EGHR-βを用いると、教師データなしに主要な信号を抽出することができます。また、ノイズが強い場合でも、主要な信号源を効率よく自動抽出することが可能になりました。

将来、脳型計算チップ[2]を使って、高速かつ低電力で信号源抽出が可能になると期待できます。また、今回提案したEGHR-βは、脳で起こるシナプス[3]の学習と類似した性質を示すことから、脳の学習メカニズムの理解にも役立つ可能性があります。

本研究は、英国のオンライン科学雑誌『Scientific Reports』(1月30日付け)に掲載されました。

背景

私たちは、雑踏の中でも特定の人の声を聞き分けることができます。このような機能を達成するための工学的なノイズ除去・信号分離アルゴリズムは、生体信号計測、顔認識、熟したトマトの判定[4]などさまざまな分野で使用されています。

しかし、これらの工学的アルゴリズムは計算の並列化ができないため、近年注目されている脳型計算チップでの実装が困難でした。また、従来の工学的アルゴリズムはノイズ除去と信号分離を別々に実行しますが、ノイズ除去時に有用な情報も一緒に捨ててしまうという問題がありました。

研究手法と成果

研究チームは、脳型の並列計算を用いて実行できるノイズ除去・信号分離の学習アルゴリズム「EGHR-β(Error-Gated Hebbian Rule β)」を開発しました。EGHR-βを用いると、出力の模範となるべき教師データなしに、主要な信号を抽出(出力)することができます。

例えば、街中に複数のマイクを設置すると、たくさんの音源から異なる重みで音声信号が足し合わされた音声データが取得されます。このような混合データをニューラルネットワーク[5]への入力と考えて、EGHR-βを使うと、信号の分布を手掛かりとして、主要な音源を抽出することができます。その際、脳で起こるシナプスの学習のように広域信号[6]を使って学習を調節します(図1、YouTube: 雑音のある状況で話し声を聞き分ける)。

EGHR-βのもう一つの強みは、ノイズ除去と信号分離を同時に行うことによって、ノイズが強い状況でも注目する信号源を抽出できる点です。自然画像の重ね合わせに強いノイズがのった合成画像に対して、EGHR-βを適用すると、信号源の自然画像を復元できます(図2)。一方、同じ合成画像に対して従来の工学的アルゴリズムを適用すると、注目する自然画像の情報もノイズと一緒に除去してしまい、適切に復元できません。このことから、EGHR-βは効率よく信号源を抽出できることが分かりました。

今後の期待

今回開発したEGHR-βは計算の並列化の観点で優れ、脳型計算チップでの実装が容易です。また、ノイズが大きい状況でも、信号の分布の違いに着目して効率よく信号源を抽出できます。EGHR-βを用いることによって、さまざまな環境下で高速かつ低電力で信号源抽出をするデバイスの開発が実現できると期待できます。

また、EGHR-βでは広域信号に応じて個々のシナプスの増強・減衰が切り替わりますが、近年、実際の脳の神経細胞の生理実験でも類似の結果が報告されています注1)。そのため、本研究は脳の学習メカニズムを理解する上でも有用だと考えられます。

注1)Zhang, J. C., Lau, P. M. & Bi, G. Q. Gain in sensitivity and loss in temporal contrast of STDP by dopaminergic modulation at hippocampal synapses. Proc Natl Acad Sci USA. 106, 13028–13033 (2009).
Salgado, H., Köhr, G. & Treviño, M. Noradrenergic “tone” determines dichotomous control of cortical spike-timing-dependent plasticity. Sci Rep. 2, 417 (2012).
Paille, V. et al. GABAergic circuits control spike-timing-dependent plasticity. J Neurosci. 33, 9353–9363 (2013).

原論文情報

  • Takuya Isomura and Taro Toyoizumi, "Error-Gated Hebbian Rule: A Local Learning Rule for Principal and Independent Component Analysis", Scientific Reports, doi: 10.1038/s41598-018-20082-0

発表者

理化学研究所
脳科学総合研究センター 神経適応理論研究チーム
基礎化学特別研究員 磯村 拓哉 (いそむら たくや)
チームリーダー 豊泉 太郎 (とよいずみ たろう)

報道担当

理化学研究所 広報室 報道担当
Tel: 048-467-9272 / Fax: 048-462-4715
お問い合わせフォーム

産業利用に関するお問い合わせ

理化学研究所 産業連携本部 連携推進部
お問い合わせフォーム

このページのトップへ

補足説明

  1. 教師データ
    機械学習の分野では、「教師あり学習」という問題設定がしばしば登場する。この問題設定では、出力の模範となるべき教師データが与えられて、その出力を模倣するようにニューラルネットワークなどが学習を進める。これに対して教師データが明示的に与えられない問題設定を「教師なし学習」と呼ぶ。本研究では後者の問題を扱っている。
  2. 脳型計算チップ
    脳の回路を模擬したニューラルネットワークによって計算を実行する装置。計算速度および電力消費の点で既存のフォン・ノイマン方式のチップより優れている。ニューロモーフィックチップとも呼ばれる。
  3. シナプス
    脳の神経細胞をつなぐ接合部位で、神経細胞間の信号伝達を担う。神経細胞の活動に応じてシナプスの信号伝達効率が変化し、学習が進むと考えられている。
  4. 熟したトマトの判定
    トマトのスペクトル画像に対して、ノイズ除去および信号分離の工学的アルゴリズムを適用すると、トマトの成熟に関わる色素に対応した画像成分を自動抽出できる。抽出した信号源のスペクトルはリコピンおよびクロロフィルの吸収スペクトルと一致し、高速液体クロマトグラフィー法で調べた両色素の濃度とも良く対応する。
  5. ニューラルネットワーク
    脳の回路を模擬した計算方式。複数の単純な計算素子(ニューロン)が互いに信号をやり取りすることで計算を進める。フォン・ノイマン方式のコンピュータ上でエミュレーションされることも多い。脳型計算チップは、このニューラルネットワークを専用のハードウェアを使ってより効率的に実装したもの。
  6. 広域信号
    シナプスの学習を広範囲で修飾する生体信号。シナプスの信号伝達効率はシナプスの前後のニューロンの活動に応じて変化し、この個々のシナプスの変化の違いが記憶の識別に重要だと考えられている。一方で、多数のシナプスの学習を比較的広範囲で修飾する物質(ドーパミン、ノルアドレナリン、GABAなど)も報告されている。

このページのトップへ

雑音のある状況で話し声を聞き分ける場合の図

図1 雑音のある状況で話し声を聞き分ける場合

四つの童話の朗読音声と複数の雑音を「信号源」とし、それらの信号源が異なる重みで混ざった合成音声のみを使って、そこから主要な信号源を抽出した。この合成音声を「入力」としてニューラルネットワークを学習させることで、教師データなしにそれぞれの童話の朗読音声を抽出(「出力」)できる。脳で起こるシナプスの学習にヒントを得て、「広域信号」を使って学習を調節する。
※イメージクレジット いらすとや、朗読音声 LibriVox(librivox.org)

ノイズの大きな状況下で合成画像から自然画像を復元の図

図2 ノイズの大きな状況下で合成画像から自然画像を復元

四つの自然画像と複数のノイズ画像を「信号源」として、それらの重ね合わせである合成画像を生成し、「入力」とする。これらの合成画像のみを使って、元の自然画像を復元(「出力」)した。EGHR-βは、信号の分布の違いに着目することで、強いノイズが混じっている場合でも、信号源の自然画像を復元できる。従来手法を使うと、ノイズ除去の計算ステップで自然画像に関する情報も捨ててしまうため、適切に復元ができない。
※自然画像 Caltech101 dataset(Fei-Fei et. al., IEEE CVPR, 2004)

このページのトップへ