日本大学生産工学部 研究報告B(文系)第51巻
36/60
─ 34 ─結果は大きく変化しないことが示唆される。一方,どのコーパスからコンコーダンスラインを抽出したか(ソース)は6番目に重要度の高い要因となっていた。各コーパスに属するコンコーダンスラインの言語的特徴(例えば文構造や文意のわかりやすさ)は,各要因が複雑に相関しており,どのコーパスが文法学習のソースとして最も適切かを判断することは難しい。しかし,日本語訳が利用可能なパラレルコーパスであるSCoREは,文構造や文意のわかりやすさともに他コーパスよりも評価が高く,これらが回答パターンに影響を与えていたと考えられる。最後に,本研究で作成したランダムフォレストモデルの妥当性を検討する。Fig.4は,ランダムフォレストで生成する決定木の数とエラー率の関係を可視化したものである。これを見ると,木の数が100を超えたあたりからエラー率の変動が収束している。このことから,本研究のモデルで用いた木の数(500)は妥当であることが示されている。そして,作成したモデルの精度をテストデータで検証した結果,78%という十分な値が得られた。したがって,文法学習のしやすさに影響を与える要因は,Fig. 3に示す順序であると判断される。この結果は,今後SCoREに掲載する英語例文作成の基準となるだけでなく,コーパスを利用したDDL,ならびに文法学習のための教材作成に有益な示唆を与えるものである。4.まとめ本研究の目的は,SCoRE, CoBLE, WebParaNews, BNCの4種のコーパスに収録されている英文について,学習者による英文難易度評価の観点から,DDLを行う上で各コーパスの英文がどの程度適切なのかを客観的に評価することであった。また,新たに開発した評価アンケート(質問紙)についての作成手順,収集したデータの分析方法,結果の解釈の仕方について詳しく述べ,また,質問紙の実例を本稿に付して,教育関係者が自由に活用できるようにした。ランダムフォレストを用いて,文法学習のしやすさの評価に影響を与える質問項目の重要度を推定した。その結果,文法学習のしやすさに大きく影響を与えていたのは,文構造のわかりやすさ,文意のわかりやすさ,および日本語訳の有無であった。また,SCoREは,文構造や文意のわかりやすさの点で,他の3種のコーパスよりも評価が高かった。本研究によって,文法学習のしやすさに影響を与える要因の順序が明らかになったことは,今後,SCoREに収録する英語例文の作成基準となるだけでなく,コーパスを利用したDDLを含む文法学習のための教材作成に有益な示唆を与えると考える。しかしながら,本研究の成果を解釈する際には次に述べる限界点も考慮する必要がある。1点目として,今回の英文難易度評価は質問紙による学習者の反応に基づいて分析されている。ゆえに学習者の集団属性,例えば英語習熟度が変われば本研究の結果に影響がでる可能性もある。今後の研究では学習者の反応に加え,テキストマイニングの手法に基づく機械的・客観的な評価(例えば,統語的複雑さ,リーダビリティ,単語頻度,未知語数など)を取り入れることも求められる。2点目は英文の難易度評価に使用した英文素材の選定手順に恣意性が残ることである。この問題を解決するためには,各ソースコーパスの特徴を定義し,そこに含まれる英文をランダムにサンプリングする必要があるだろう。学習者による英文難易度評価を行った本研究は,SCoREのような教育用コーパスの適切さを客観的に明らかにしていく「初めの一歩」の研究である。今後,一連のコーパス評価研究シリーズとして,SCoREに収録されている英文について,例えば,複数の教育用書籍で扱われている教育用語句のカバー率,SCoREの意味分野別カバー率の分布などの観点からも,SCoREの教育コーパスとしての適切さを評価していく予定である。謝辞:本研究はJSPS科研費JP17H02366の助成を受けたものです。Fig.4 Error Convergence Based on the OOB Error
元のページ
../index.html#36