このブログを検索

2019/11/30

2019.11.30 ICNALE SD V1.0 リリース

3年間かけて構築を進めてきたアジア圏国際英語学習者コーパスICNALEの新モジュールSpoken Dialogue(ICNALE SD)が完成しました。(リリース日は2019.12.1予定)。

http://language.sakura.ne.jp/icnale/

アジア圏10か国・地域の学習者405人と母語話者425人による合計160万語のインタビュー発話データです。欧州圏学習者の対話コーパスLINDSEIと比肩しうる規模になりました。

ICNALE SDは,当研究室が手掛ける4つ目の学習者コーパスですが(作文→校閲作文→独話→対話),作業は難航し,これまでで最も大変でした。シンガポールでのデータ収集が進まず,やむなくマレーシアに調査地を変更する等,紆余曲折もありましたが,3年間で100万語超のデータを収集して公開するという当初のミッションがなんとか達成され,ほっとしています。


上記は,撮影時に協力者にかぶってもらったマスクです。各国に送付し,終了後,返送されてきたので,現在,研究室はちょっと不気味なハローウィーン状態になっています。

年度末までの3か月は,ICNALE SDのデータを使った分析を進めます。