1. Home
  2. 広報活動
  3. クローズアップ科学道
  4. クローズアップ科学道 2022

研究最前線 2022年9月20日

人の会話が理解できるAIをつくる

人は社会生活において、言語を使って情報を共有したり知識を蓄積したりしています。近年、急速に身近な存在となっているAIが、人が日常的に使用している言語(自然言語)を理解できるようになれば、私たちの生活はより便利で豊かなものとなるはずです。そこで、「自然言語を理解できるAI」の研究開発に取り組んでいるのが、乾 健太郎チームリーダー(TL)です。

乾 健太郎の写真

乾 健太郎(イヌイ・ケンタロウ)

革新知能統合研究センター
目的指向基盤技術研究グループ
自然言語理解チーム
チームリーダー

AIにおける最大の難問

近年、人が話しかけると"それなり"の返事をしてくれるAIを搭載したロボットや電子デバイスが身近なものとなってきている。今や一般的になったAI自動翻訳ツールを使っていると、私たちはAIが言葉をかなり理解していると錯覚しがちだが、実は「このような文章は、このように翻訳する」といった手本となる翻訳例のデータを大量に読み込み、学習したパターンに基づいて翻訳しているにすぎない。このようなAIが学習するために使う大量のデータを「教師データ」といい、「教師データ」から汎用的なルールやパターンを見つける手法を「機械学習」という。しかし、パターンを真似て対応することと、行間を補いながら人の言葉を正確に理解し操ることとの間には非常に大きなギャップがある。もし、人が何気なく使う言葉の意味を正確に理解できるAIが実現すれば、私たちの生活はより便利で豊かになるだろう。

「例えば、会話の中で『評判のきつねうどんを頼んだら、期待通りの味に大満足』のような発話があったとします。このとき、我々はこれが『とてもおいしかった』とすぐに理解できますよね。ところが、今のAIにはできません。私たちは、この発話の行間に経験や知識で情報を補って推測し、理解しています。頼んだ後に食べていること、『大満足』はおいしかったこと、といった具合です。我々の日常生活にはこのような"常識"とも呼べる知識があふれていますが、それをAIに習得させるのは困難です。これをAIの"知識獲得のボトルネック"と呼んでいます」

では、無限とも言える知識をどうやってAIに習得させるのか。さらに、どうやって推論や予測に繋げるのか。この問題はAI研究において長年にわたって最大級の難問の一つとされてきた。これまで多くの研究者たちが取り組んできたが、いまだに解決策は見いだせていない。

代ゼミと自動採点を共同開発

「自然言語を理解できるAI」の実現という究極の目標を見据えつつ、現在、乾TLらが取り組んでいるのが、文部科学省のAIPプロジェクトの中間目標「AIを活用した記述式問題の自動採点技術」の開発だ。

これは、国語の現代文などの記述解答をAIに自動採点させるプロジェクトだ。2021年7月から、学校法人高宮学園代々木ゼミナールと共同で開発した高校生向けのトレーニング教材の提供を開始しており、学習者はいつでもどこでも記述式問題の学習支援を受けることができる。

現代文の記述式問題では、「傍線部の内容を◯文字以内で説明しなさい」といった出題が多く、限られた文字数で求められる内容に言及しているかどうか明確な判断基準がある。そこで、解答例と人間が与える採点例を教師データとしてAIに機械学習させることで、AIが採点例から採点基準を学習し自動で採点できるようにした(図1)。

AIによる記述答案採点の図

図1 AIによる記述答案採点

評価項目ごとの点数を推定し(上)採点の根拠箇所を提示する(下)。根拠が明確なので学習者は高い納得感を得ることができ、自動化によって教員も手間のかかる採点作業から解放される。

従来のAI搭載ロボットなどと大きく異なる点は、単にパターンで採点しているのではなく、解答の文脈や文章構成が正しいかを分析するなど、学習者に採点理由を分かりやすく説明する技術や、採点の確信度を数値化する技術を新たに開発し導入していることだ。確信度が低ければ、その場合だけ人による確認をしようと判断できる。瞬時に採点されるので、学習者はその場で何度も書き換えて、その都度、点数を確認できる。

「これらは世界初の試みです。自然言語をAIに理解させるのは、現在の技術ではまだまだハードルが高い。一方で、現代文の記述式問題のように明確な採点基準が存在する文章であれば、AIでも根拠を示した採点ができることを実証しました」

現在、複数の教育事業者と共同で、英作文など現代文以外の科目への応用も始まっている。

「マルチホップ推論」で行間を読む

また、乾TLらは「自然言語を理解できるAI」の実現に直結するような技術開発も進めている。その一つが「知識-テキスト混合グラフ上のマルチホップ推論」だ。これは、専門家が記述した知識(知識データ)と、自然言語で書かれた知識(テキストデータ)を組み合わせ、背景となる知識まで多層的にAIに機械学習させることで推論へと導く方法だ(図2)。学術論文や小説、ウェブサイトやSNSなど世の中にはさまざまな知識がテキストに書かれ蓄積されている。それらの膨大な知識を活用する方法をAIに教えるのが乾TLらのマルチホップ推論の特徴であり、それによって「知識獲得のボトルネック」の解消も期待できる。

AI研究は、人間に対するサイエンス、と捉える乾TL。「人にできることをどこまで機械でできるのかを見定めることは、人間そのものの理解に工学的な道具立てで迫る営み」と語る。AIが行間を読めるようになったとき、どのような人間像が見えてくるのだろうか。

知識-テキスト混合グラフ上のマルチホップ推論の図

図2 知識-テキスト混合グラフ上のマルチホップ推論

青の斜体字がテキストデータに書かれている内容。緑字が知識データ(「知識ベース」ともいう)にある内容。知識データにはない「パーキンソン病の発症にはα-シヌクレインが関わっている」という記述を別のテキストデータから得て「アポモルフィンはアルツハイマー病に効果がある可能性がある(オレンジ色の点線)」という未知の情報を多段階(マルチホップ)で推論する。

(取材・構成:山田久美/撮影:古末拓也/制作協力:サイテック・コミュニケーションズ)

関連リンク

この記事の評価を5段階でご回答ください

回答ありがとうございました。

Top