このブログを検索

2024/08/01

2024.8.1 文化審議会国語分科会第2回言語資源小委員会

表記に出席し、報告を行いました(@虎ノ門、文科省)。

詳細はこちら

私の報告では、今後の言語資源整備を考える上で、下記の3点が大切ではないか、といった問題提起をさせていただきました。

1)継続

コーパスを作って終わり、とするのではなく、作り続けていく、データを取り続けていく、ことが重要。それによって言語変化を観察することが初めて可能になる。

2)普及

同じく、コーパスを作って終わり、とするのではなく、集めたデータを(言語学者だけでなく)一般の人が気軽に使っていただけるよう、わかりやすい検索システムなどを作っていくことも重要。それによって一般の方に言語資源の価値が伝わる。

3)社会実装

言語学者にとっての価値ある資料、というだけでなく、一般の社会課題の解決にコーパスを活用していく方途をしっかりと考えていくことが重要。教材開発、テスト開発などの教育面はもちろん、海外で行われている医療系でのテキストマイニングなども参考に。

石川報告資料より

基本的に、上記の3点を支えるのは継続的な国の支援ということになります。コーパス開発はしばしば属人的で(誰か個人の作業となりがち)、その人が退職するとノウハウも失われる、ということになりがちです。この意味で、3年、5年の競争的資金だけでなく、10年、20年のスパンでの息の長い支援が不可欠だと思われます。そうすることで、研究機関は人を長期にわたって雇用し、その中でベテランから若手へとノウハウを継承していくことが可能になります。あわせて、コーパスを調べることだけでなく、コーパスを作ることや、メンテナンスすることも、同等に価値ある「研究」だと認めていく学界の風土の醸成も重要でしょう。

虎ノ門の官庁ビル(いいお天気でした。雲が夏ですねえ)