このブログを検索

2023/08/28

2023.8.28 言語資源ワークショップ2023で研究発表

表記で発表を行いました。最近、夏の恒例行事になりつつあります。


国立国語研究所「言語資源ワークショップ2023」の概要


発表者:石川慎一郎

発表題目:「学習者コーパス研究における横断・縦断データ統合の意義」

当日の発表ビデオより


これまで、わたしは、横断データであるI-JASという学習者コーパスを使い、参加者を初級・中級・上級などに区分して相互に比較することで、疑似的に、発達モデルを議論してきました。

しかし、ここにきて、完全な縦断法(個人を数年間追跡してデータを集める)でとったB-JASという新しいコーパスがリリースされましたので、両者から得られる発達モデルがどの程度一致するのか、主として計量的観点から検証を行いました。その結果、両コーパスから得られる大局的な発達パタンや発達モデルはほぼ同等であるものの、各段階の特徴語などにはかなりずれが生じることが示されました。これは、なかなか悩ましい結果とも言えます。。。