本日初日の表記展覧会を観覧しました。
それは英語辞書史で重要な意味を持つ竹原常太先生(1879-1947)の「スタンダード和英辞典」と神戸大の関係についての展示でした。
神戸大学 大学教育推進機構/大学院国際文化学研究科外国語教育論講座/数理・データサイエンスセンター 石川慎一郎研究室の活動報告サイトです。 研究室トップページ http://language.sakura.ne.jp/s/
本日初日の表記展覧会を観覧しました。
それは英語辞書史で重要な意味を持つ竹原常太先生(1879-1947)の「スタンダード和英辞典」と神戸大の関係についての展示でした。
学習者コーパス(I-JAS)研究会(2021/10/23)
■ 日時:10月23日(土)10:00~12:00(日本時間)
■ 発表内容
1)佐々木藍子(東京学芸大学大学院連合学校教育学研究科(配置校:横浜国立大学))
「日本語を第二言語とする学習者の接続助詞「から」の接続形式の発達過程―発達過程で見られる非規範的な使用の要因―」
2)大神智春(九州大学留学生センター)
「日本語学習者による多義語コロケーションの習得」
どちらも勉強になる発表でした。また,終了後の茶話会も盛り上がりました。石川からの問題提起。(最近私が考えていることです)
・たとえばN4やN3の学習者の中間言語というものは措定できるか?
・中間言語は習得の極致の姿か否か?
・欧州の学習者コーパス研究が(建前としては)初級データを見ないことをどう考えるか?
・Chomskyモデルをどこまで前提として習得を考えるのか?
各社の管理職さんを集めた「ミドルマネジメント向けDXセミナー」で講演を行いました。
「ミドルマネジメント向けDXセミナー」
【開 催 日】2021年10月8日、15日、22日、29日(全4回)(各回金曜 18:00~19:30)
【会 場】オンライン(zoom)
【受講対象】企業や自治体でDXを活用して事業の効率化やイノベーションを企画する立場の職員・社員(部長・課長・係長クラス)
第3回 10月22日(金) 18:00-19:30 コミュニケーション分野 「言語情報の有効活用!」
・コーパス言語データからの情報抽出 [神戸大学 大学教育推進機構 石川 慎一郎 教授 ] ・言語データの分類と関連データの発見 [神戸大学大学院工学研究科 白石 善明 准教授]
【主催】 一般社団法人 デジタルトランスフォーメーション研究機構(RIDX)
【共催】 神戸大学 数理・データサイエンスセンター
【後援】 公益財団法人 新産業創造研究機構・神戸商工会議所
当日は,言語処理の基本についてまとめた後,User Localというテキストマイニングプラットフォームを紹介し,amazonのレビュー(2社の炭酸水)を使ってデータを収集する手法と応用可能性についてお話しました。仕事柄,いろいろなところに出かけて話しますが,言語学は文系と思われているためか,企業の方に話す機会はこれまでなかったので,いろいろ勉強になりました。
先生方向けに探究指導の講演を行いました。
演題:教師のための探究指導入門ー生徒の資質を伸ばす指導ー
最初は先生方にとっても戸惑いが大きいと思いますが,探究はうまく学校に入れば,(部活指導に代わる/と並ぶ)教師の新たなやりがいともなります。先生方には楽しんでやっていただきたいですね。
理事会では,石川がとりまとめをしていた論文賞規程の審議がありました。新しい賞が学会の活性化につながればと思います。
・・・・・・・・
私は,大学英語教育学会(JACET),英語コーパス学会,計量国語学会の3つの学会で,学会賞(的なもの)の規程づくりの仕事を担当させていただきました。学会賞の定義や運用には,どの学会でも同じような問題があります。メモとして。
学会賞規程を作る際の論点リスト(石川私見)
・人に出すのか,業績に出すのか?
・単一業績に出すのか,複数業績でもいいのか?
・年限(過去2年以内に刊行された・・・等)は設けるか,設けないか,設けるならどこまでか?
・単著に限るのか,共著も認めるのか?
・共著(共同研究)を認める場合,
(a) 筆頭だけか2番目以降も可か?
(b) 非会員が入っていても可か?
(c) 指導教員などとの共著も可か?
(d) 本人の貢献度をどうやって確認するのか?
・著書と論文に限るのか,それ以外(言語資料,ツール,実践・・・)も含むのか?
・同一人物に重複授賞できるのか,できないのか?
ベルギーに本拠を置く国際学習者コーパス学会(Learner Corpus Association)が提携して初開催された表記大会 (The Graduate Student Conference in Learner Corpus Research 2021)に出席し,1セッションの司会を担当しました。欧州の若い院生さんの発表に刺激を受けました。
また,初日のSylviane Granger氏の講演も,LCRの歴史を振り返り,今後を展望するうえで有意義でした。
Granger先生講演視聴メモ(石川)
※ハンドアウトなしの講演だったので走り書きです。聞き違いあるかもしれません。
●LCRの起こり
・Granger氏,1990s後半にCLから着想
・当時のCLには,diatypic(genre)/ temporal/ geographical varietiesは考慮されていたが,学習者は入っていなかった。この状況は"unfair"(NNSのほうが多い)
・AILAでLeechに会い,LeechからICAME(1990)に誘われる
・その後,GreenbaumのICEプロジェクトとかかわる。ICLEはICEのサブデータとして始まった。
・ICLE(Granger 1993)に加え,HKUST (Milton & Tsang 1993),Longman Corpusなどが構築される。
●初期LCRの特徴
・目的は2つ(SLAの理論研究+教育実践)
・L1影響研究(大半はmono-L1 corpusだった),対照研究,誤用研究に焦点
・学生作文の特性を示す量的モデルの不足 (Milton & Tsang)
・CIA (Granger 1993),Computer-aided Error Analysis (CEA)(Granger)
●LCRの現在
・学問分野としてのLCRの確立。雑誌+ハンドブック(CUP)+学会組織+大会(2001~)
・英語以外の学習者コーパスも(言語を超えた一般化可能性を議論可)
・方法論の精緻化:CIA/CEAは,SLAからの批判を受けてさらに発展。批判は耳に痛いがそれが内省の契機となる。
・主な批判の論点,comparative fallacy(Bley-Vroman 1983)比較すると中間言語をそれ自身として見られない/古いCAの回顧版(reminiscent)
・CIA→Granger (2015) CIA2 :ENS/NNSとも,多様性を配慮(学習者はProficiency Levelやexposure量など)
・CEA→多層システムInterlanguage Annotation(教育学と言語理論の両面を意識したエラータグ Lozano & DiazNegrill 2013)Full error tagging vs Problem-oriented error ragging 習熟度ごとの学習者が出会うエラーを示す
・統計の精緻化:初期はカイ二乗(χ2)。LCRのcrudeな統計の使い方に批判。Durrant & Schmitt (2009)NS/NNSをかたまりで比較して個人差を無視。効果量を示さないなど。その後,"statistical turn" in CL in general and LCR in particular
・関心対象の広がり:Granger 1998で扱った文法(補語,POS)・語彙(高頻度動詞)・談話とレトリックなどは今も研究される。加えて,phraseologyがflagship locus of research(理論と実践のbridge。SLAのusage-basedの考えかたとも関連。インプット頻度とsaliency)。複雑性・洗練性の新しい指標。
・結果の解釈:strong on description but weak on interpretationという批判。しかし記述は重要。thorough in-depth description of key linguistic phenomena はLCRの強み。影響原因は多種多様のはずなのにL1に集中しすぎてきた。
・教育応用:LCR準拠教材はなお少ない。many pedagogical implications but few up-and running pedagogical applications。単一母語学習者コーパスに基づく特定母語話者用教材だとマーケットが小さい。出版社はgeneric one-size-fits-all なものがほしい。Granger & Paquot 2015(各種母語話者用の汎用無料教材)テスティングへの活用も期待大きい(学習者コーパスから錯乱肢を抽出するなど)
●LCRの未来
・当初の2つの目的に戻る(SLA理論+実践) CAFの新しい習熟度指標作りなど。
・cross-sectional pseudo longitudinal分析
・適性・動機付け・教材などの影響も考えるべきだが(Moller 2017), L1影響のさらなる追求も。
・Integrated contrastive analysis model (Grange 1996): 2言語コーパス+学習者コーパス。 Jarvis (2000)4種の証拠。多種のL1背景を持つ学習者コーパス分析を通して,より厳格にL1影響を調査。
・統計と言語学の良いバランスを。Larsson Egbert Biber (forthcoming) 2009-19のCL論文を調査。統計研究が増えてテキスト分析が減る。用例こそが命。
・LCR/SLAの統合には努力してきたが,LCR/FLTの融合にはさらなる努力を。
・エラー研究を再興する: ELFではerrorもfeature/ innovationとみなされ,errorはstigmatizedされるが,"Errors matter" L1別のおかしやすいエラー一覧表は有意義。Swan & Smith 1987の仕事をLCRで拡充するなど。
・ELFとの関係: ELFもproficiencyを重視。どの点でerrorがfeatureになるのか? normなしでどうやって議論するか?中国のELFとヨーロッパのELFは違う。intelligible かどうかを決めるのはほぼ不可能。前置詞はattended at X だと問題ないが,look at / forは大事。どこで線を引くのか? error annotationでは教師が大事だと思うところに注目すべき。知ることは重要。
私の所属している神戸大数理データサイエンスセンターでは,中等教育との連携も積極的にやっており,表記のコンテストを実施しました。
後期がスタートしました。神戸大は対面・遠隔併存ですが,発声が必要となる学部の語学の授業,また,来日できない学生がいる大学院の授業とも,残念ながら,前期に続いて,遠隔オンデマンド形式での実施です。
また,本日付けで,3名の研究生が大学院のゼミに入りました。これでゼミ生は8名となります。当ゼミとしてはおそらくは過去最大数で,同時には見られないため,現在は,週3日,M2/ D3/ 研究生にわけて3回のゼミを実施中です。さすがにいつまでもこれでは持たないですが,3月に4名が修了予定なので,この半年の山を越えれば少し楽になりそうです。修了学年の学生さんにとっては,残り半年。悔いの残らないよう,良い論文を書きあげてほしいです。
表記学会をホストし,発表を行いました。
発表題目:「1961^2021日本語小説コーパス」の構築:日英対照小説研究の新しい可能性