本研究では,人と共に成長するAIを活用した高度なオンライン語学学習支援システム,特に英会話をターゲットドメインとした学習支援AIシステムの仕組みについて検討し,大規模データ収集およびプロトタイプの構築と評価を実施します.現在,日本における英語学習は一つの大きな岐路を迎えています.2020年以降,大学入試で問われる英語の試験が4能力(読む・書く・聞く・話す)に拡大され,小学校での英語の授業の導入も年々進んでいるなど,我が国政府における英語学習の重要性の認識は高まる一方です.文部科学省の提言によれば,今後求められる英語教育は,単語や文法の基礎的な知識の獲得に留まらず,多様なバックグラウンドをもった他者とコミュニケーションを図っていける能力の養成であるとされています .
そのような状況に先駆けて,本申請の提案者である早稲田大学では,1990年代終盤から2000年代にかけて教育学部の中野美知子名誉教授を中心にコミュニケーション志向英会話授業Tutorial Englishが開発されてきました.
当該プログラムは汎用的な語学能力判定基準であるCommon European Framework of Reference for Languages(CEFR/セファール; ヨーロッパ言語共通参照枠) に基づいて設計されており,主要な言語コミュニケーション基礎能力は,「文法や語の知識などの言語学的能力」,「敬語のような他者との関係性の中で運用される社会言語学的能力」,「伝えるべき内容の構成に関する語用論的能力」の3観点から構成されています.それらの観点を基礎として,理解・生成・インタラクション・ファシリテーションなどの側面から整理された総合的な会話タスクが達成項目として具体的に定義されています. CEFRは,そもそも違う背景を有する人々が暮らすことを前提とした多言語・多文化主義(plurilingualism and pluriculturalism)を標榜するEUの,長年の語学教育の叡智の結晶とも言えるでしょう.
しかしながら,現実の日本の英語教育における重大な問題は,未だ文法・語彙の知識の習得に終始しており,増大し続ける英語による他文化圏とのコミュニケーション能力の養成のニーズに対して,現時点でも英会話教育現場(小中高大学,一般の英会話教室)で指導者のリソースが不足していることです.今後,超高齢化社会や指導内容の高度化によって,リソース不足がさらに深刻化すると予想されます.さらにこのような英会話の指導は各指導者の知識・経験に依存する部分が多く指導が属人的になりやすい本質的な問題を抱えているため,学習者と教育者の双方にとって,AIによる高度な英会話学習支援の価値が大いにあると期待されています.
CEFRでは,英語のスピーキング能力は,主にRange(語彙の広さ),Accuracy(文法的正しさ),Fluency(流暢さ),Phonology(発音の良さ),Interaction(インタラクションの適切さ),Coherence(一貫性)などの要素によって説明されると定義しています.この中でも特に,他者と会話する上で特に重要かつ既存の自動判定テストで不足しているものはInteractionの視点です.Interaction能力に含まれる項目には,話題の生成と制御,話者交代(ターンテイキング),傾聴の態度,談話構成能力(会話を構成していくための能力)等があります.CEFRの中で,Interaction能力に関する運用能力は以下のように定義されています.これらは会話相手の存在する状況でなければ観測できない現象でしょう.
英語能力の実用的な自動判定に関する代表的なシステムでは,学習者にしばらく考えた後に1分間程度発話させ,その音声から音響及び言語特徴量を抽出して能力を判定し,結果を受験者に提示するようなものが主であると言えます.しかしながら,個別の音声を録音させて判定するものであり,Interaction能力等の対人コミュニケーションスキルまでには深く踏み込んではいないば場合がほとんどでした.多くの日本人学生はリスニングとリーディングについては一定の能力を有することが多いですが,他者と自然に英語で主体的にコミュニケーションを取るための能力については個人差が大きく,実際の能力と実際の授業で求められる最低限の能力のミスマッチから,学習効果の上でも授業進行の上でも問題が生じることが報告されており,我々の行った予備調査でも通常のリスニングとリーディングのテスト結果と真のスピーキング能力には乖離があることがデータ分析から実証されています .一般的に,リーディング・ライティングテストの結果のみでクラス分けをした場合,実際の総合的な英会話能力よりも高いレベルのクラスに分類されてしまう傾向にあることが分かっています.ここに,高度にインタラクティブな会話エージェントを英会話教育に応用する意義があります.
2020年初頭に起きた新型コロナウィルス蔓延に端を発する歴史的とも言える世界的なオンライン教育の爆発的なニーズの高まりにも着目しなければなりません.提案者の早稲田大学においても,全国に先駆けてすべての大学講義をオンライン化することを発表しました .前述のTutorial Englishでも,Moodle と呼ばれるオンライン授業プラットフォームのテレビ会議機能を活用した個別英会話教室Tutorial English Onlineが急ぎ準備され,2020年5月から提供が開始されています.
さらに,2019年12月に閣議決定された文部科学省主導の「GIGA(Global and Innovation Gateway for All)スクール構想 」では,子供たち一人ひとりに個別最適化された教育 ICT環境の実現に向けて2023年度までに義務教育段階にある生徒児童1人1 台の情報端末,および高速大容量の通信ネットワークを一体的に整備することが決まっています.このように,義務教育から大学教育,さらに一般の大人に至るまで,オンライン教育サービスの必要性は論を待たないでしょう.
本提案者の早稲田大学知覚情報システム研究所と,Tutorial Englishの運営母体である株式会社早稲田大学アカデミックソリューション(本研究における主要な産学連携先企業)は,2019年初頭にTutorial English開発者の中野美知子名誉教授をチームに迎え会話AI技術による英会話支援プロジェクトの検討を開始しました.2019年度はパイロットデータの収集と語学学習理論の整理を通して,語学教育へのAI導入実現への手がかりをつかんできました.そのような経緯もあり,2020年のコロナ禍による本格オンライン化計画の初期段階から,大規模データ収集・分析と各種AI技術による全面的な英会話教育支援の方法を検討してきました.早稲田大学でのTutorial Englishのプログラムでは2018年度だけで受講者1万2千人以上,のべ年間約6万時間以上のオンサイト英会話が行われている実績があり,この環境を活用すれば,高度なAIシステムの実現が大きく前進・加速することが期待できます.