下記に参加しました。
___________________________________________________
学習者コーパス(I-JAS)研究会
2023/6/18 Zoom
1000-1130 《特別講演》中俣尚己(大阪大学)
「『日本語話題別会話コーパス:J-TOCC』の構築と活用法」
____________________________________________________
J-TOCCは話題別にデータを集めた世界的にもユニークなコーパスです。講演では、中俣先生が、ご自身の研究の展開の中でJ-TOCCを着想されるに至ったことが紹介され、大いに感銘を受けました。よいコーパスというのは、突如できあがるものではなく、研究者の長年の下準備また、ベースになる豊富な学術研究の蓄積があってはじめてできるものであると改めて感じました。
自分メモ(コーパス研究の一般的な方法論に関して)
・特徴語の抽出にはLLRに多重補正をかけるべきか否か?
・LLRかレンジ比率(使用率)か?
・比較基準に想定されていない潜在変数が介入している蓋然性が高い場合のデータ処理方法としてはどのような工夫がありうるか?
・比較を精緻化して変種ごとの特徴を言うべきか、全体像をまとめあげるべきか?