開発された英会話能力判定システムを用いて,オンライン英会話授業の中で受講者の能力が短期・長期的にどのように成長しているのかを,大規模リアルタイム英会話データ分析から得られる知識と英語教育の専門家が持つ指導方針を融合して可視化・言語化し,学習者と教育者の双方に対して納得感のあるフィードバックをする枠組みを開発しています.
人工知能(AI)は人間の職業や権利を奪い兼ねないものとして脅威の対象としても語られはじめて久しいですが,それはAIをつくる人間の倫理観にも強く依存するものです.来たるべき未来社会において,人々と調和的に共存し,社会全体の能力を拡張できるようなAIはどのようにデザインされるべきでしょうか?ここで我々は,特定のグループやコミュニティでそのような社会的AIが受容される要件には以下のようなものがあると仮定します.
一般的に,狭いAIと広いAIのどちらの場合でも実現への確かな歩みを重ねるためには,よいドメインと適切な評価関数を探さなくてはなりません.例えばかつてGoogle DeepMindのAlphaGoが成功した要因は,そもそも彼らが囲碁という価値が明確なドメインを選んだことにあるとも言えます[5].上記のような社会性を要求される会話AIの場合ならどうだろうでしょうか?研究代表者の松山はこれまで,多人数会話をファシリテーションできるロボットや,他者との関係性を構築できる会話エージェントの研究を長らく行ってきました.しかし,それらはまだ社会性を実現するための個別かつ基礎的な能力に留まっています.音声言語処理や対話システムの研究分野は長く深い歴史を有しており,深層学習の出現により音声認識や言語理解・生成の要素技術はさらに発達してきたが,どういう方針で複雑な会話AIのコンポーネントを統合すれば良いかという点においては本質的な進展はまだないと言っても過言ではありません.
今,英会話教育におけるCEFRという概念は,人間を社会的環境に状況づけられた存在(Social Agent)として見たときに,特定のタスクごとにどのようにコミュニケーション能力・戦略の質を評価するべきかについて広範かつ包括的に整理した能力判定基準であるとも言えます.例えば,インタビューというタスクは他者のアイデンティティの適切な理解というコミュニケーションタスクであり,そのために様々なコミュニケーション基礎能力や高度な戦略を要するものであると言えるでしょう.プレゼンテーションは客観的なデータに基づく説得的な説明を行うタスクであるし,ネゴシエーションは双方のゴールを理解し合意へ至るタスクです.この点において,CEFRは語学学習の基盤であると同時に会話AIの設計方針としても極めて理にかなった枠組みであると我々は考えています.
本研究では,英会話授業の教室を一つの小さな社会と見立てて,そこでチュータや学生と一緒に成長できる社会的AIの設計パラダイムを提案している点に独創性があります.すでに述べたように,一般的に会話AI設計の難しさは,大量かつ良質な会話データを収集しにくいことと性能評価の複雑性や恣意性に起因しますがが,本研究ではデータ収集に関してそもそも大規模データ収集のしやすい英会話授業をドメインとして選択していること,性能評価についてはCEFRというすでに確立されている指標を用いることで信頼性の高い教師データが期待できることから,従来の会話AI・教育工学研究に比べてアドバンテージが担保されています.加えて,CEFRは上に挙げた社会的AIの3要件(社会的規範の遵守,信頼の獲得,合意に基づく目的達成)を内包しており,それを人間と共存できるような社会的AIの設計に応用した研究は世界的にみて前例がないものです.
特定の状況,特定のコミュニケーション能力に限定したならば,機械学習アルゴリズムの工夫と充分なデータさえあれば,例えば 1時間のタスク会話(Tutorial Englishの1コマのクラスに相当)に破綻なく追従・ファシリテートできる会話AIは開発しうるでしょう.このように,人間とAIを社会的環境に状況づけられた存在として等価的に見て,特定のタスクごとに各々の言語コミュニケーション能力や戦略を広範かつ包括的に評価しながら重要なマイルストーンを一つずつクリアしていくことで,人間社会と共存できる汎用的な社会的会話AIの実現へと確実に近づいていくと我々は信じます.同時にその過程で,以下のような現実社会への現実的なベネフィットが期待できます.
以上のように,本研究課題は,実用的な英会話をドメインとした社会的AI実現のための基盤研究を通して,AI技術の発達の恩恵を社会の誰もが最大限に享受できる未来社会の実現に貢献できることが期待されます.
[1] Tetsunori Kobayashi and Shinya Fujie. Conversational robots: An approach to conversation protocol issues that utilizes the paralinguistic information available in a robot-human setting. Acoustical Science and Technology, 34(2):64–72, 2013.
[2] Niklas Luhmann, Trust and Power, 1982.
[3] 山岸俊男, 小宮山尚, 信頼の意味と構造 — 信頼とコミットメント関係に関する理論的・実証的研究, INSS Journal. 2 pp. 1-59, 1995.
[4] Timothy Bickmore and Justine Cassell, Relational agents: a model and implementation of building user trust, In Proceedings of the SIGCHI conference on Human factors in computing systems, pp. 396-403. ACM, 2001.
[5] Fei-Yue Wang, Jun Jason Zhang, Xinhu Zheng, Xiao Wang, Yong Yuan, Xiaoxiao Dai, Jie Zhang, and Liuqing Yang, Where does AlphaGo go: From church-turing thesis to AlphaGo thesis and beyond, IEEE/CAA Journal of Automatica Sinica 3, no. 2, pp. 113-120, 2016.