広報活動

Print

2009年7月13日

独立行政法人 理化学研究所

脳の仕組みを模倣した情報検索システムで、遺伝子研究の効率化に成功

-理研サイネスで蓄積した集合知を学習させた脳型データベースで、研究者の思考を支援-

世界初の大規模な脳型データベース検索システム

「遺伝子研究」と呼ばれる分野では、ヒトやイネなどの膨大な遺伝子情報の中から、さまざまな情報を組み合わせて、重要な働きをしている遺伝子を絞り込んでゆく作業が必要です。高等動植物では数万という遺伝子を持っており、さらに近年の解析機器の発達により、研究者の扱う情報量は増え続け、これまでのやり方では成り立たない事態に突入しています。そこで、生命科学の膨大な知識やデータを研究者に代わって学習し、研究者が望む道筋に沿って自動的に推論して内容を提示するという、思考支援型の情報処理システムが求められています。

生命情報基盤研究部門(BASE)の研究グループは、コンピュター上に疑似的に模倣した脳神経ネットワークに、膨大な生命科学情報を学習させた脳型データベースを開発し、研究者が求める情報を瞬時に想起してランキングする検索システムを開発しました。さらに、このシステムを病気の関連遺伝子を探索している研究者に、思考支援システムとしてインターネット上で無償提供したところ、多くの成功事例にシステムが貢献していることを確認しました。

これは、セマンティックウェブという国際標準規格に基づき理研が独自に開発した、世界初のデータベース総合インキュベーション基盤である「理研サイネス」を活用して、国際的な連携でデータ編さんした文献や遺伝子、代謝物などに関する情報を、数千万の疑似的な神経細胞(ニューロン)の結びつきに見立て、ヘブ則という学習ルールで統計的にモデル化し、「GRASE」と呼ばれる検索エンジンで瞬時に推論検索を実行します。研究グループは、このシステムをPosMed(ポスメド)と名付け、2005年から2008年の約4年間に研究者に提供、理研の大規模ENU変異マウス開発プロジェクトで65例以上のヒト疾患関連遺伝子の同定に貢献するなど、成果をあげました。また、第三者の研究グループによる類似検索システムとの比較でも、高い正解率が報告されるなどの評価を得ています。

理化学研究所
生命情報基盤研究部門
部門長 豊田 哲郎(とよだ てつろう)
Tel: 045-503-9610 / Fax: 045-503-9553