当サイトは、Javascriptを使用しています。Javascriptを無効にして閲覧した場合、コンテンツが正常に動作しないおそれやページが表示されない場合があります。当サイトをご利用の際には、Javascriptを有効にして閲覧下さい。

2013年8月9日

独立行政法人理化学研究所
独立行政法人情報通信研究機構
国立大学法人東京大学

新しいコンピューター「知的ナノ構造体」の構築が可能に

－量子ドット間の光エネルギー移動を活用し“正確に速く”意思決定－

ポイント

自律的に環境に適応し最適に情報処理を行う「粘菌」の行動原理をヒントに
多くの組合せ選択肢から最も確率の高い答えを超高速で出せるナノシステム
不確実な環境下で正確で高速な意思決定を要求される局面に応用可能

要旨

理化学研究所（理研、野依良治理事長）、情報通信研究機構（坂内正夫理事長）と東京大学（濱田純一総長）は、単細胞生物「粘菌^[1]」の行動原理に基づき、ナノサイズの量子ドット^[2]間の近接場光^[3]エネルギーの移動を用いて、高効率に意思決定をする全く新しい概念のコンピューター「知的ナノ構造体」が構築できることを、実際のデバイス構成を想定したシミュレーションにより実証しました。これは、理研基幹研究所理研-HYU連携研究センター^[4]揺律機能研究チーム（当時）の原正彦チームリーダー（現理研グローバル研究クラスタ客員主管研究員）、金成主研究員（現物質・材料研究機構国際ナノアーキテクトニクス研究拠点特別研究員）、青野真士研究員（現東京工業大学地球生命研究所研究員）と、情報通信研究機構光ネットワーク研究所フォトニックネットワークシステム研究室の成瀬誠主任研究員、東京大学大学院工学系研究科電気系工学専攻及びナノフォトニクス研究センターの大津元一教授らの共同研究グループによる成果です。

動的に変化する不確定な環境下で速く正しい意思決定を要求される局面では、多くの組合せからなる選択肢の中から、最も報酬確率の高い解答を効率良く導き出すことが求められます。そのためには「最適解ではなくても極めて最適解に近く、かつすばやく解が得られる」ことが必要です。こうした問題のモデルとして、複数のスロットマシンから多くのコイン（報酬）を得る「多本腕バンディット問題^[5]」があり、定式化されています。この問題では、最も報酬確率の高いスロットマシンを正確にかつ速く判断することが要求されますが、そのためにお金や時間を掛けすぎると、速い判断ができずに報酬も減ってしまいます。このような正確さと速さの二律背反が作り出すジレンマ状況での最適な意思決定戦略を探ることは、さまざまな分野での応用課題と密接に関連するため、近年活発に研究されています。また、自然界の生物においても正確で速い判断が生存競争を勝ち抜く上で必要なことから、この問題は生物の行動戦略、さらには社会現象の最適化を探る研究にも関係しています。

理研揺律機能研究チームでは、粘菌を用いて、多数の組合せ選択肢から的確な答えを求める研究を行ってきました。そして粘菌の行動観察の結果を使って多本腕バンディット問題を正確にかつ高速で解決できるアルゴリズムを開発しました。このアルゴリズムは、粘菌の行動原理に類似した動的特性を多様な物理プロセスに置き替えることでデバイスに応用可能です。

今回、共同研究グループは、粘菌の行動原理と量子ドット間の近接場光を介したエネルギー移動プロセスに類似性があることを見出し、実際のデバイスに応用可能な近接場光を利用したアルゴリズムを開発しました。そして、このアルゴリズムが多本腕バンディット問題の正解を探索できること、さらに、同問題の解法の中で、最速とされていたアルゴリズム「Softmax法^[6]」よりも、速く正確な意思決定が実現できることを、シミュレーションにより実証しました。

今回の成果は、全く新しい原理で動作する“知的コンピューティングデバイス”などを構築できることを示唆します。本研究成果は、英国のオンライン科学雑誌『Scientific Reports』（8月9日付け：日本時間8月9日）に掲載されます。

背景

粘菌は、アメーバのような不定形の単細胞生物で中枢神経系を持ちませんが、全体として秩序立った変形・移動運動や、置かれた環境中で自らの行動を最適化する合理的な意思決定を実現できます。このため、自律分散型情報処理システムのモデル生物として、近年その研究が活発化しています。

理研揺律機能研究チームの原正彦チームリーダー、青野真士研究員、金成主研究員らは、粘菌が複数の足を伸ばしたり縮めたりすることで、どの足を伸ばせば報酬（エサ）を最大化でき、罰（嫌いな光刺激）を最小化できるかを試行錯誤する様子から新しい計算原理を導きだし、「粘菌コンピューター」を2005年に特許出願し、2007年に論文発表を行いました。粘菌が足を伸ばすか縮めるかの判断は、粘菌内部の時空間振動ダイナミクスの自己組織化により実現しており、その外部刺激への応答は揺らいでいます。つまり、同じ刺激に対していつも同じように応答するのではなく、時として、自ら嫌いな光刺激に向かって足を伸ばすような行動も示します。これは、与えられた規則、すなわち光のあたる部分には行かないという規則に反することによって、規則におおむね従いながらも、時に規則にしばられず答えを柔軟に探す機能を示しています。このような、揺らぎを適切に調律して試行錯誤を行う自律的な能力（揺律機能^[7]）が、効率的な解探索を可能にすると考えられています。

研究チームは、この「粘菌コンピューター」を用いてセールスマンが多くの顧客を1回ずつ訪問する際の最短の経路を探すという、難しい組合せ最適化問題の答えを探し出すことに成功し、他にも多数の組合せ選択肢から的確な答えを求める研究を行ってきました。このように生物が周囲の環境の変化に適応して行動する様子を情報処理と捕らえる新たな視点を提供するとともに、従来のコンピューターとは全く異なる新しいタイプのコンピューター「知的ナノ構造体」の実現可能性を示してきました。

今回の共同研究では、粘菌の行動観察から、多本腕バンディット問題を正確にかつ速く解決できるアルゴリズムを開発しました。このアルゴリズムは、粘菌の行動原理に類似した動的特性を多様な物理プロセスに置き替えることよってデバイスに応用できるという、他のアルゴリズムにはない特徴があります。

一方、情報通信研究機構の成瀬誠主任研究員、東京大学大学院工学系研究科の大津元一教授は、ナノサイズでの光と物質の相互作用（近接場光）を用いたナノ光デバイス、光システムを世界に先駆けて提唱し、理論と実験基盤を構築してきました。

これらの研究成果を基に共同研究グループは、粘菌の行動原理と量子ドット間の近接場光を介したエネルギー移動プロセスに類似性があることを見出しました。そして、実際のデバイスに応用するため、近接場光を利用して多本腕バンディット問題を効率よく解決する新たなアルゴリズムの開発に挑みました。

研究手法と成果

近接して配置された量子ドット（Quantum Dot: QD）間では近接場光を介して、隣り合わせた量子ドットにエネルギーが移動する現象が見られます。量子ドットに生じた光エネルギー（励起子）は、近接場光を介してエネルギーの損失なく隣りの量子ドットに移動することができますが、行き先となる量子ドットでエネルギーが散逸します。散逸の生じやすさに応じて光エネルギーの移動パターンはある確率に基づいて異なってきます。この光エネルギーの確率的な移動パターンを用いて、粘菌の確率的な行動を模倣することによって、粘菌に見られるある種の情報処理能力を、量子ドットで再現できることが分かりました。具体的には、2台のスロットマシン（A、B)の多本腕バンディット問題を解くことを考え、新たなアルゴリズムを開発しました。そして、次のようなナノシステム「QDM（QD-based Decision Maker）」を考案し、開発したアルゴリズムを検証しました。

図1aに示すように、1辺の長さがそれぞれa、√a、2a、つまり、大きさが小(S)、中（M）、大（L）の3種類のサイコロ型の量子ドットを、「L-M-S-M-L」のように1列に並べます（図1b）。QD_Sに注入された光エネルギー（図中の青矢印）は量子ドット間の近接場光を介して移動し、左右のQD_LLとQD_LR の最低エネルギー準位より放射されます。ここで、QD_LLとQD_LRの一番低いエネルギー準位（LL₁とLR₁）に対して外部から光照射（図中の赤矢印）によって状態占有効果（ステートフィリング）^[8]を生じさせると、QD_MLとQD_MRの最低エネルギー準位（ML₁とMR₁）からの放射確率（QD_Sから移動した光エネルギーが放出される確率）が変化します。これを2台のスロットマシンの多本腕バンディット問題に当てはめたとき、左のQD_MLから光（図中の緑矢印）が観測されればスロットマシンAをプレイ（作動させること）し、右のQD_MRから観測されればスロットマシンBをプレイするものとしました。その結果、スロットマシンから得られた報酬によってQD_LLとQD_LRの最低準位に供給する外部光の強度を調節することで、粘菌が左右に動き回り、より良い報酬が得られる方向を探す行動を綱引きのようなモデルとして模倣し、異なる色の光を照射したり観察したりすることで実際のデバイスとして応用できることが分かりました（図2）。

このモデルは従来、多本腕バンディット問題の解法の中で、最速とされていたアルゴリズムSoftmax法を上回る性能を示しました（図3）。また、近接場光を介したエネルギー移動は、エネルギー効率に非常に優れ、電子デバイスにおけるビット反転（あるビットが 0 の場合 1 に、1の場合 0 にすること）に必要なエネルギーの1万分の1のエネルギーで動くことが分かっています。

今後の期待

近接場光を介した光エネルギー移動は、“相互作用できる複数の量子ドットのいずれに対しても生じ得る”という特性に基づいており、論理ゲートの組合せで動作する既存のデジタルコンピューターとは原理が全く異なります。動的に変化する不確実環境での意思決定問題の根底には、場合の数が指数関数的に増大する「組合せ爆発」の問題などもあります。これは、既存のデジタルコンピューターが最も苦手としている問題です。本研究では、量子ドット間の近接場光を介した光エネルギー移動を用いて高効率な意思決定ができることを初めて示したものであり、ナノテクノロジーやナノフォトニクスの特徴を用いて、従来技術の限界を大きく超えることができる可能性を示唆しています。

今回の成果は、ナノスケールでの物理プロセスにこれらの特徴を活用し、全く新しい原理で動作する「知的コンピューティングデバイス」や「自律的に環境に適応して最適な運動を選択できる知的なナノ構造体」を構築できることを示しています。

このシステムは、動的に変化する不確実な環境下で速く正確な意思決定を要求される数多くの局面で有用です。例えば、モバイル通信技術における最適通信チャネルの決定、金融工学における最適資産配分の決定などへの応用が期待できます。

原論文情報

Song-Ju Kim, Makoto Naruse, Masashi Aono, Motoichi Ohtsu & Masahiko Hara, "Decision Maker Based on Nanoscale Photo-Excitation Transfer", Scientific Reports, 3:2370, doi:10.1038/srep02370

発表者

理化学研究所
グローバル研究クラスタ
客員主管研究員原正彦（はらまさひこ）
（元理研―HYU連携研究センター　揺律機能研究チームチームリーダー）

独立行政法人情報通信研究機構　光ネットワーク研究所
フォトニックネットワークシステム研究室
主任研究員成瀬誠（なるせまこと）

国立大学法人東京大学　大学院工学系研究科
電気系工学専攻
ナノフォトニクス研究センター
教授大津元一（おおつもといち）

報道担当

独立行政法人理化学研究所広報室報道担当
Tel: 048-467-9272 / Fax: 048-462-4715

独立行政法人情報通信研究機構広報部報道担当
Tel: 042-327-6923 / Fax: 042-327-7587

国立大学法人東京大学工学系研究科/工学部広報室報道担当
Tel: 03-5841-1790

補足説明

1.粘菌
粘菌（真性粘菌 Physarum Polycephalum変形体）は、アメーバのような不定形の単細胞生物であり、中枢神経系を持たないが、全体として秩序立った変形・移動運動や、置かれた環境中で自らの行動を最適化する合理的な意思決定を実現できる。
2.量子ドット
ナノメートル（10^-9メートル）寸法の半導体の微粒子のこと。量子効果が顕著になり、エネルギーレベルが離散化する。
3.近接場光
光の波長よりも微小な物質に局在した光。空間中を伝搬する普通の光（伝搬光）と異なり、光の長波長近似が破綻するため、電気双極子禁制なエネルギー準位に対しても、近接場光を介した場合には光エネルギー移動を起こすことができる。
4.理研－HYU連携研究センター
2009年にアジア全域に連携研究ネットワーク構築を目指して設立された漢陽大学（ Han yang University (HYU)、韓国ソウル市）との連携センター（～2013年3月）。ナノサイエンスやナノテクノロジーを基盤としたバイオやIT分野を含む融合ナノ領域研究をアジア各国の研究機関と連携して推進し、ポストナノ時代の新規情報処理系研究の展開を図った。
5.多本腕バンディット問題
M台のスロットマシンを有限回プレイできる状況で、獲得する報酬の総和を最大化するための最適戦略を探る問題。プレーヤーには、各マシンに割当てられた報酬確率は知らされていない。従って、手持ちのコインを何枚も投入することで、どのマシンからどのくらい報酬が得られたかを記録し、報酬確率を見積る必要がある。正確に見積もるためには、なるべく多くプレイしなければならないが、過剰な試行は「探索コスト」の増大を招く。一方、探索を早く打切りすぎると、確率の低いマシンを選んでしまうリスクが高まる。こうして、プレーヤーは「探索－搾取ジレンマ」と呼ばれる探索の「速さ」と「正確さ」のトレードオフに直面する。スロットマシンの報酬確率が動的に変化する可能性にも対応しなければならない。この状況は、動的に変化する不確定な環境下において速く正しい意思決定を要求される局面を表象した非常に重要な課題であり、この問題を効率的に解くアルゴリズムは、モバイル通信、金融工学などの分野で広範な応用展開が期待されている。
6.Softmax法
強化学習の分野において、ボルツマン分布型の確率に従って答えを選択する方法。人間の意思決定行動に近いモデルとして知られている。
7.揺律機能
従来のデバイス開発では排除されるべき要素であった「揺らぎ」や「曖昧さ」を積極的に活用し、今までにない柔軟かつ自律した機能の実現を目指した造語。
8.状態占有効果（ステートフィリング）
あるエネルギーレベルを励起子が占有したとき、パウリの排他原理により、他の励起子がそのエネルギーレベルに入ることを阻害する効果のこと。

QDM (QD-based Decision Maker) の模式図と状態遷移図の画像

図1　QDM (QD-based Decision Maker) の模式図と状態遷移図

（a）量子ドット間のエネルギー遷移
各辺の長さがそれぞれa、√aの量子ドットQD_S とQD_M が近接している。この場合、量子ドット QD_S での光学的励起は近接場光（US₁M₂）を介して、近隣のQD_M に移動可能である。なぜなら、量子ドットQD_S の量子数（1, 1, 1）のエネルギー準位 S₁と量子ドット QD_M の量子数（2,1,1）のエネルギー準位 M₂は共鳴準位であるからである。
（b） QDM（QD-based Decision Maker）
5つの量子ドットQD_LL、QD_ML、QD_S、QD_MR、QD_LRから構成される。添字のLLは大きいLと左のL、MLは中くらいの大きさのMと左のL、Sは小さいSで中央に位置し、同様にMRは中くらいのMと右のR、LRは大きいLと右のRを意味する。
（c）状態遷移図

図2　左右の放射確率の差

外部からの照射光の強度調節（位置j）とエネルギー準位ML₁とMR₁からの放射確率。各jに対して、マシンA（左）を選ぶ確率とマシンB（右）を選ぶ確率の差を表している。

図3　QDM と Softmax 法のパフォーマンス比較

（a）効率比較1
報酬確率がそれぞれマシンA（PA= 0.2)とマシンB（PB= 0.8)の場合のQDM と Softmax 法のパフォーマンス。
（b）効率比較2
報酬確率がそれぞれPA= 0.4と PB= 0.6の場合のQDM と Softmax 法のパフォーマンス。報酬確率の差が小さくても、QDMは早くから確率の高い方を選択可能である。
（c）適応性の比較
報酬確率がそれぞれPA= 0.4 と PB= 0.6の場合のQDM と Softmax 法のパフォーマンス。 3000ステップごとにPAと PBの値が入れ替わる。最初にPB= 0.6の方が確率が高いと判断する状態に到達し（縦軸で100％）、PA= 0.6 と PB= 0.4とに確率が逆転した場合にも、Softmax 法にくらべて QDMの方が立ち上がりが速いことが確認できる。ここで、 Softmax 法に対しては、自ら環境変数の変化を感知できないので、3000ステップごとにパラメタをリセット（選択確率1/2から始まる）するというアドバンテージを与えている。