このブログを検索

2021/08/29

2021.8.29 中国湖南大学主催日本語学習者コーパスシンポジウムで講演

 下記で講演を行いました。湖南大学には,ずいぶん前に,講演で訪問したことがあります。懐かしい先生方と再会できて楽しいひと時でした。

 また,迫田久美子先生が構築されたI-JAS/C-JASという先駆的な2つの言語資料の尽きない価値を再発見する良い機会ともなりました。



2021/8/29
湖南大学シンポジウム「学習者コーパスと第二言語習得研究:量的研究と質的研究」(Online)


プログラム

開会あいさつ 【張佩霞】

第1部 日本語学習者コーパスの広がり

多言語母語の日本語学習者コーパスの現状 【迫田久美子】

中国語母語の日本語学習者コーパスの現状  【張佩霞】


第2部 I -JASを用いた日本語習得研究

I-JASから考える量的研究としてのコーパス分析が目指すもの 【李在鎬】

I-JASから考える第二言語習得の計量的概観 【石川慎一郎】

I-JASから考える見過ごされがちなテシマウとチャウの用法: 量と質との協働研究   【砂川有里子】


第3部 多様なコーパスを用いた日本語習得研究

縦断発話コーパスから考える学習者の動詞誤用の発達過程【迫田久美子】

横断作文コーパスから考える誤用研究の一パターン 【張佩霞】

縦断作文コーパスから考える形式名詞の習得:「もの」と「こと」を対比しながら    【蘇鷹】


第4部 総括ディスカッション

トピック:コーパス活用上の留意点

登壇者【石川慎一郎/李 在鎬/砂川有里子/張佩霞/蘇鷹】

司会者【迫田久美子】


閉会あいさつ【張佩霞】


石川発表


シンポジウム開会式(テンセントVoov上で実施)
※聴講者画像は映り込んでいないことを確認しています






2021/08/28

2021.8.28 学習者コーパス(I-JAS)研究会を聴講

下記に参加し,発表を聴講しました。

■ 日時:8月28日(土)14:00~16:00(日本時間)

■ 発表内容

1)蘇鷹(湖南大学)「中国人日本語学習者の形式名詞の習得ー「コト」を中心に」

2)堀恵子(筑波大学・東洋大学ほか)「日本語教育にデータ駆動型学習を取り入れる試み―機能語用例文データベース『はごろも』を利用してー」


いずれも大変興味深い発表でした。第1発表でとりあげられた「コト」は意味機能が多く,分析の際のコーディングが大変そうだなと思いました。


石川メモ:明鏡2版の意味分類
※明鏡2版では24区分。ちなみに明鏡初版の語義数は23で1つ増えた! 信頼できるコーディングがあれば因子分析などで語義を整理することができるかもしれない。

1) この世に起こる現象や出来事、人間の行為、また、それらの成果・推移などを広くいう。特に、大きな出来事や事件をいう。

2) 《連体修飾語を受けて》それによって特徴づけられるさまざまな事柄をいう。

3) 《「…の━」の形で》それに関連するさまざまな事柄を表す。

4) 《人代名詞や人を表す語+「の━」の形で》その人に関するさまざまな事柄を表す。また、その人そのものについてもいう。(★2版で追加?)

5) 《連体修飾語を受けて》ことばで表される内容を表す。意味や指示対象物をいう。

6) 《人代名詞に付いて》それについて言う意を表す。…に関して言うと。

7) 《雅号・通称などと本名との間にはさんで》同一人物であることを表す。すなわち。

8)《活用語の連体形を受けて》
ア 《思考・知覚・発話などの精神作用を表す動詞を伴って》精神作用の内容を表す。
イ 活用語を名詞化する

9) 命令的な伝達を表す。…ように。

10) 《「…━だ」の形で》
ア 特定の相手に対する勧告・忠告・要求などを表す。
イ 感動・詠嘆を表す。

11) 《「…という━だ」「…との━だ」の形で》伝聞を表す。…と聞く。…という。

12) 《「…━か」の形で》感動・詠嘆を表す。…ことだろう。

13) 《「…━だろう」の形で》推測を詠嘆的に表す。

14) 《「…━だし」の形で》理由や根拠を述べて(または、他にも理由や根拠があることをほのめかして)、下に続ける。

15) 《「…━この上ない」の形で》事柄の程度が最高である意を表す。

16)  《「━に(は)」の形で、感情を表す活用語の連体形や完了の助動詞「た」の付いた形を受けて》その感情を事実として強調する。

17)  《「…━と思う」「…━と存ずる」などの形で》それが相手や第三者についてなされた推測の内容であることを明示する。

18)  《「…の━」の形で、程度を表す副詞を受けて》その意味を強める。

19)  《「A━はAだが…」の形で》事実として肯定しながらも、十全に肯定できない要素があることをいう。一応Aであることは確かだが、しかし…。

20)  《形容詞の連体形を受けて》全体で副詞のように使って述語を修飾する。

21)  《「…って━よ」の形で》〔俗〕さとすような調子で、相手を説得したり言い含めたりする。

22) 《「…までの━だ」の形で》まで

23) 《「…だけの━はある」の形で》だけ
 
24) 《動詞の連用形・名詞・形容動詞の語幹などに付いて、「…ごと」と濁って》そのような事柄の意を表す。


2021/08/27

2021.8.24-27 関西大学大学院外国語教育学研究科で集中講義

表記でコーパス言語学の集中講義を行いました。博士後期課程の授業なので,開講にならない年も多く,久しぶりに関大に伺いました。

今回は,内容の半分を遠隔に,残り半分を対面で行う形式で実施しましたが,理論的なところはビデオで学び,実習的な部分を対面で指導するのは非常に効率的であったと感じました。このスタイルは,コロナ後も継続していきたいものです。

関大キャンパス前のモニュメント


2021/08/18

2011.8.18 AILA(国際応用言語学会)出席

オンラインで開催された表記大会で各種関連発表を聴講しました。また,下記の共同発表(筆頭発表者:奥切恵先生@聖心女子大)が行われました。

Megumi Okugiri  (University Of The Sacred Heart, Tokyo)/ Shin Ishikawa (Kobe University)/ Tom Gally (The University Of Tokyo)/ Lala Takeda (Showa Women’s University)

"The approach to introductions in English presentations by Japanese university students"



私はデータ解釈の事前ディスカッションに参加しただけですが,準備の過程で,奥切先生はじめ他の先生からいろいろ教えていただき,得難い体験でした。


・・・・・・・・・・・・・・・・・・・・・・・・・・・・・
コーパス関係発表の聴講メモ(文責:石川)

(1) Reframing individual differences as intra-individual variability: Reconceptualising emotion, motivation and willingness to communicate.
Peter Macintyre (Cape Breton University) 
※直接コーパス系の発表ではないが,個体と集団の関係についてのとらえ方は学習者コーパス研究に密接にかかわるもので,今回聴講した中で特に有益であった発表(石川)

1)個人差(individual difference:ID)には2つの意味
・人の体系的な違い(知能,態度,正確,同期づけ,感心)
・他人とどう違うか(inter-individual variation)/個人が時間的にどう変わっていくか(intra-individual variation)
・個人を集団に概括かできないのと同じく,集団を個人に概括化できない
・Hamaker (2012) タイプの速さと打ち間違い:集団で見れば反比例(速い人はミスも少ない),個人で見れば比例(無理に速く打つとミスが増える)
・データ合成の誤謬(Simpson's Paradox)
・答えがないとみるのではなく,答えは複数だととらえるべき
・Lowie & Verspoor (2019) differences between individuals cannot and need not be generalized beyond the individual learners we are observing
・McIntyre (2021) We must stop shamelessly discarding individual level data. Uniqueness is not a problem, it is an opportunity.

2)CDST 複雑系ダイナミックシステム理論(complex dynamic systems theory)
・システム内・システム間の相互作用に注目するメタ理論
・過程(process)を詳細に調べる研究手法
・複雑性と変化を強調する物の見方
・open 個人レベルではすべての影響を予測不可
・self-organizing システム間の相互作用に依拠。吸引子(attractor)と反発子(repeller)のゆるやかな結合
・emergent 部分ではなく,調和した意義のある全体を見る
・通常のRQ:WTCは不安に関係しているか/動機づけはL2能力を予測するか/不安は楽しみと相関するか
・CDST系のRQ:WTCは不変なのに不安度が高まっている場合何が起きているのか?/動機づけの瞬間瞬間の変化はどんな要因によるか?/不安度と楽しみ度が正比例するのはどんな場合か?
・CDSTの研究法 Lavelli, Pantoja, Hsu, Messinger, & Fogel, 2008
・変化する個人を研究対象に
・変化の前・途中・後で観察を実施
・過程の中で観察の密度をあげてゆく
・観察された行動を集約的に分析。量的・質的。発達と変化をもたらす過程そのものの具現化をゴールに設定する
・idiodynamic methodでの研究のやり方
・集団ではなく個人に焦点,communication eventsに焦点
・L2の各種コミュニケーションを記録
・その間の情意面の変化を評価するため,刺激想起インタビューstimulated recall(活動時のビデオを一緒にみながら学習者の注意や気づきに関するデータを集める)(Gass & Mackey 2000)を即時実施。関心対象(不安,動機)の変化を連続的に評価し,量的データとしてまとめる
・情意面の学習者自己評価を再検討
・すべてを書き起こして分析にかける
・WTC分析なら,そもそもあえてコミュニケーションするかしないか,言語習得で最も重要な決定
・WTC=機会をとらえ,コミュニケーションを先導(initiate)しようと選択する確率
・性格的(trait-like)傾向+瞬間瞬間で変わる状況(feeling willing)
・WTCと実際のL2使用の間にはcrossing the Rubicon
・The theoretical orientation of the pyramid model requires consideration of the here-and-now experience of WTC, even though much of the early WTC research approached it at the trait level( MacIntyre 2020, 127) ピラミッドモデルは性格レベルではなく個人の瞬間瞬間の実態でとらえるべき


(2) Gender representations of tennis players in the new media: A corpus-assisted critical discourse analytic study
Adrian Yip Queen Mary University Of London
・SNN研究ではmultimodality分析重要
・social semiotic approach
・内容分析+CDA
・ウィンブルドン2018,インスタ分析
・modality指標=彩度(color saturation)×輝度(illumination)
・女性描出のキーワードはmagical(色彩の詳細な区別と賛美系形容詞が女性の語彙選択 Lakoff 1973)
・男性選手はreal world matter,女性選手はmagical world


(3) The Dynamic Patterns of Syntactic Complexity in Chinese EFL Learners’ Writing Based on a Longitudinal Learner Corpus
Yurong Zheng  Harbin Engineering University
・CLEC (Chinese learner English Corpus)(Guis Shiqun & Yang Huizhong 2003)
・SSWECCL (Spoken and Written English Corpus of Chinese Learners) (Wen et all 2005/2008)
・Verspoor et al(2008) オランダの英語学習者 3年間に18の作文。語彙複雑性(語長)と統語複雑性の変化をトラック
・中国人英語学習者対象の同様の先行研究のポイント。non-linear, dynamic, inter-individual dif, fluctuating, staged development, progression and regression
・6学期間(=3年?)の学習者79人(学力は全国平均より3-5ポイント/100 高い程度)の作文を集めた自作コーパス(11万語)で語彙的多様性を分析
・3つの語彙多様性で0田をCompleat Lexical Tutorで計算
 ・LD lexical density 内容語/総語数
 ・LV lexical variation 異なり語数の2乗/総語数
 ・LS lexical sophistication 上位2000語占有率,AWL率,off-list語率
・LDは微増,LVははっきり増加,top2000語率は減少,AWL率は上昇,off-list率も減少
・LD/LV相関は0.26-0.34
・2000語率はLDと-0,3,LVと-0.2から-0.5程度


(4) Interpreting patterns in corpora of L2 speech: The challenges of finding a meaningful L1 reference point
Dana Gablasova & Vaclav Brezina Lancaster University
・SLA/LCRの目的は,L2使用における体系的変異+L2習得過程および成果に体系的に影響する要因解明
・CIAではL1コーパスと比較することが多い
・CIAのためには2つのコーパスはcomparable(比較対象以外は統制)であるべきだが,コーパスの代表性問題は微妙
・発話コーパスに影響を及ぼす要因:モード,ジャンル,タスクタイプ,タスク属性(指示・時間・インタビュワートレーニング,インタビュワー数など)
・CACCODE(1138人,500万語),BNC Demo(1407人,430万),BNC2014 Spoken(376人,480万語),BNC64(64人,160万),LOCNEC(50人,12万)
・I think:BNCSP/LOCNEC>>>BNC Demo
・受け身 CANC>>>BNC Demo
・過去形 LOCNEC>>>BNC SP
・同じL1でも内容が変われば言語も変わる(結果の解釈は慎重に)
・Trinity Lancaster Corpus (L2対話,2053人,430万語)L1はスペイン,イタリア,ヒンディ中心。Presentatoin, Discussion, Interview, Conversation
・タスクタイプはstance takingに影響
・stance marking = a perspective toward (a) what is being communicated and (b) the interlocutors (Reilley et al 2005)
・関連副詞INT>PRES, 形容詞INT>PRES,動詞CONV>PRES


(5) Spoken learner corpora : diversity and comparability.
John Osborne/ Evgenia Nicol-Bakaldina   University Savoie Mont Blanc
・社会的対話では意味の伝達手段は無数にあるので記録すべき文脈情報は無限で分析作業はblack holeとなる(Adlphs & Knight 2010:44)
・複雑性は上昇:独話コーパス(PAROLE corpus)<縦断コーパス(独話・発話)<教室対話(とくに初級)<CLIL授業
・PAROLEの分析から。個人差はあるが,WPMについてはNNSの最頻値は100-120,NSは90-110/ 120-180。
・CEFRとの関連付け A1(30-50), A2 (60), B1(70-80), B2(90-110), C1(120-180), ENS (130-220)
・縦断コーパスSCFLE(フランス語学習者12人)分析→個人差が大きい(A型:不変,B型:下がって持ち直す,C:上がって下がる,D:上下繰り返す)。集約してしまうとよくわからなくなるが,集団としての傾向もいくらか抽出可
・教室コーパス(パリの英語学習小学生6-8歳,40分授業3週分,1年に3回撮影,教師,学習者集団,学習者個人にわけて書き起こし)
・教師は1年生向けにはmodellingや引き出し質問,命令,positiveな応答確認中心だが,2年生向けになると引き出しや,単純反復が増える
・児童は1年生だと授業内の練習時間だけでターゲット語(pear, orange, chocolate)を集中使用(反復練習など),2年生になると使用機会が授業内でまんべんなく広がる
・CLIL(フランス高校,英語で学ぶ歴史クラス)16時間の授業ビデオ,教師2人,11万語
・ExMARaLDAでアノテーションしてエクセルで解析
・インプットとアウトプットの組み合わせは複層的:教師発話によるインプット→学習者Aがアウトプットする=ほかの学習者のインプットになる・・・
・10か月間のエラー量は単元内でみると上がって下がり,全体で見てもやはり上がって下がる


(6) The Effects of Explicit and Implicit Instruction on the Use of Discourse Markers in Japanese EFL Learners’ Speech
Kazunari Shimada MEXT Senior Specialist For Textbooks
・DM指導と学習者のDM使用の関係をさぐる
・大学生58人,オンライン授業,英語力はTOEIC365-500
・まず学生はQAタスク(海外どこ行きたい?)と発話タスク(友達は大事か?)で自分の発話を録音して提出(pre)
・その後教師が講義ビデオでDMを直接指導(模範解答内のDMを強調表示)+教師は個別学生にメールでフィードバック
・学生ははロールプレイタスクを実施
・教師は個別学生にメールフィードバック
・学生は絵描写タスクを実施
・教師は個別学生にメールフィードバック
・学生はQAタスクと発話タスクで自分の発話を録音して提出(post)
・教師が講義ビデオでDMを直接指導+教師は個別学生にメールでフィードバック
・pre/postと似た発話テスト(delayed)
・pre/post/delayの3段階変化(QAの場合)
・and 17--8--32
・anyway/finally 0--0--0
・because 14--11--16
・for example 0-9-0
・and because soのような簡単なものはもともと多用
・指導でfor example, how about, wellなどの使用は増える
・時間がたつとDMの多様性はへる


(7) Lexical complexity and spoken L2 English proficiency in the Trinity Lancaster Corpus
Raffaella Bottini Lancaster University
・Lexical density(内容語vs機能語)
・Lexical sophistication (上級語比率)logCW (content word)/ log FW(function word) BNC2014と比較
・Lexical diversity(異なり語分布)MTLD(TTR改良版)
・発表者はLex Complexity Tool(Bottini 投稿中)を新規に開発 各種の複雑性指標に加え,BNC2014語彙表との対照結果を表示できる
・3指標に対するL2習熟度の影響(主効果)FW(0.02) CW(0,03), MTLD (0.1)
・3指標に対するL1タイプの影響(主効果)CD(0.04) MTLD (0.02) FW(0.01)
・ともに影響は弱い
・総じていえば,習熟度があがるとMTLDとCWはあがり,FWは下がる傾向
・MTLD イタリア<スペイン<中国
・FW 中国<イタ<スペ
・CW イタ<中国<スペ
・L1が英語に近い言語(スペイン語)であるほど高頻度語を多用し,多様性の低いテキストを産出


(8) Measuring speaking fluency automatically for the purpose of research and assessment
Nivja De Jong Leiden University
・応用言語学:cognitive(思想を負荷なく言葉へ)/utterance(速く話す)/perceived fluency(相手からどう聞こえるか) (Segalowitz 2010)
・ACTFL, IELTS, TOEFLなど:pauseやslow paceといったdisfluencyの少なさを評価
・Bosker et al (2013/14)
・人手による主観評価の84%は客観指標で説明可能
・話速を人工的に変えても評価は一定
・PRAAT-script(2019) salient pauseを自動検出,発話速度も。filled pause/ repetition/ repairの自動検出には対応していない
・PRAAT script 2020を開発。従前不可だった要素にも対応
・intensity(dB)の山と底,voiced peaksで1語(シラブル)を自動検出。人手コーディングとの相関は話速で.86,articulation rateで.92


(9) Linguistic strategies for expressing stance in advanced L2 students’ critique writing: a corpus based study
Abdulwahid Al Zumor KING KHALID UNIVERSITY
・stance= personal views/ attitude/ position 
・73人のサウジの大学院生の批評エッセイ(サウジにおける学習障壁),7.8万語
・Lancsbox使用
・事前に知識と使用経験を調査,booster,hedge, attitude markerはある程度既知だが,self-mentionはあまり意識的には知らない
・booster: very > clear>without>a lot...
・hedge:  general> should > claim> assume > would...
・attitude :important>agree>only>fail>good...
・self-mention:  I>we>my>our...
・明示的指導・トレーニングが大事


(10) Dynamic data-driven learning
Ana Frankenberg-Garcia University Of Surrey
・発見学習(discovery learning)=構成主義的教授法
・Piaget (1936) 主体的・蓄積的に新しいことを学んでいく
・Vygotsky(1978)圧倒的なタスクを与えず少しずつ足場かけ
・Johns (1991) DDLはawareness raisingに有用
・DDLの2つの方法(Gabrielatos 2005; Boulton 2010)
・the hard, hands-on way(コンコーダンサでデータを直接検索)
・the soft, hands-off way (あらかじめ教師が選んだコンコーダンスラインや単語リストを分析)
・Frankenberg-Garcia (2012, 2016):両方のアプローチは相補的
・第3の方法(dynamic approach to DDL-D-DDL)を提案:ミニデータ(just-in-timeを検索体験させる(hands-on)が,複雑なソフトで大量の言語データを扱わせることはしない(hands-off)
・2つのシステムを利用
・ColloCaid (www.collocaid.uk)(Frankenberg-Garcia et al. 2019) 英文を入力すると主要語にポップアップが出てよくあるコロケーションを示す。必要な場合は画面上で修正可能
・コベントリ大学が運営するBAWE QuicklinksEnglish(British Academic Spoken English Corpus, 英国の優良学生エッセイ,650万語,Sketch Engineで公開):入力語に対してBAWEからの用例を表示する。教師が校閲に使ったデータセットをencyclopediaとして共有(例:学生がsupport that SVと書いたがコーパスではsupportの目的語は名詞であった,など)
石川補足
collocaid(上記では入力した英文中のusingに対して,
widely use,use for など高頻度のコロケーションが提案されている。
※入力した英文の文脈に応じたuseのコロケーションではなく,
単にuseの取りうるコロケーションをリストする)

bawe quick link(作文中のよくある誤用例についてコーパス用例を示す)



(11) Corpus-driven Approach of English Vocabulary Learning at Chinese Tertiary Level Program
Dr. Yurong Zheng (Harbin Engineering University) 
・大学で「English Lexicology」という授業を担当(単語の基礎概念,語彙発達,形態的構造,語形成,語の意味,イディオム,辞書など)
・ RIPEモデル: resource-providing, information-inputting, paradigm-setting and evaluation-enhancing(資料配布,情報提示,データ分析枠組み指導,評価改善)
・資料配布ではCOCA, COHA, CLEC (100万語の中国人学習者コーパス),自作の縦断学習者コーパス,オンラインの新語辞典(wordspy.com)や語彙サイト(lextutor)を併用
・情報付与では,語形成や単語の意味変化を解説
・分析枠組みとして「on-line/onlineの意味の差」や「nessとityの生産性」などのテーマを与え,頻度・コンコーダンスなどを指導して練習させる
・評価として,形成的評価を採用(評定の6割):討論,発表,レポート
・質問紙とインタビューで受講学生の評価を調査:好反応


(12) Learning L2 Non-Congruent Collocations: The Effect of a Corpus-assisted Contrastive Analysis and Translation Approach
Dr. Rezan Alharbi (King Saud University) 
・Non-congruent collocations (L1にないコロケーション):習得・使用・理解ともに困難
・NCコロケーションの習得を促進する環境の解明は不十分
・言語対照(L1/L2翻訳)が有用? コーパス活用が有用?
・DDL(実物性・没入性・学習者自主性)
・CAT(L1/L2 contrastive analysis+translation)(認知面,語彙転移,バイリンガルメンタルレキシコン表象,語彙習得の心理学的モデル,翻訳)
・両方を組み合わせて実験実施
・サウジ学習者129人が,30種のNC型コロケーション(形容詞+名詞)を習得
・3条件(コーパスなし言語対照あり/コーパスあり言語対照あり/コーパスあり言語対照なし/統制)
・プレテスト(能動的想起,受動的想起)
・6セッションでターゲットの学習
・直後ポストテスト,3週間の遅延ポスト
・コーパスあり言語対照あり学習群が最高値


(13) Direct and Indirect Data-Driven Learning: Affordances and Constraints
Xiaoya Sun (Nanyang Technological University) 
・DDL隆盛(Gilguin & Granger, 2010)
・直接アプローチと間接アプローチ(Boulton 2017)
・にもかかわらず教師はDDLと言えば直接DDLだけと思い込み,それを手間と感じるため教授法の主流になっていない
・中国人学習者のヘッジ習得について,直接DDLと間接DDLの効果を比較
・共通事前学習
(a) MICUSPからヘッジあり文と人工的にヘッジを抜いた文を組み合わせてハンドアウトとして配布,学習者ペアに2文を比較させる(容認性判断,容認性を高める言語的工夫を探す,それらの形式的特徴を書き出す)
(b) ヘッジの機能別リストを配布
・直接DDL組(MICUSPで知らないヘッジを探し,コンコーダンス機能で意味と用法を推測させる,任意の3つのヘッジを選び,ICNALEの中国人作文とNS作文で比較させる,ICNALEの中国人・NS作文を1つずつ選び使われているヘッジを調べる,MICUSPの上級作文からヘッジをうまく使っている段落を探させる)
・間接DDL組(知らないヘッジの意味探しを辞書を引いて行う,その後,ヘッジを抜いたMICUSP用例のプリントをもらい空欄を埋める,原文のヘッジと比較,自分の過去作文のヘッジを修正)
・直接群のヘッジ使用量はpre/post/dpで27--36--31,間接群は32--48--39
・間接群のほうが効果高い
・学習者アンケートでは直接群はコーパスが役立つと述べたがコーパスが辞書より有益だという点については懐疑的,間接群は指導が役立ったと述懐


(14) Corpora in interaction: A conversational study of Data-Driven Learning interactions with the FLEURON database
Dr. Biagio Ursi (Aix-Marseille University) 
・DDLは英語以外にも効果
・学習者はFLEURONデータベース(石川注:French as a Foreign Language at University: Digital Resources and Tools)(https://fleuron.atilf.fr/内のAudio Visualコーパスをコンコーダンサで分析
・仏語学習者と教師のやりとりをマルチモーダル(視線,ジェスチャー,姿勢)データとして分析(会話分析的)

FleuronHPより使用可能なフランス語ビデオ資料の例




2021/08/16

2021.8.16 東京外大博士論文審査会

下記の審査会に遠隔で出席しました。


 ローレンス・ニューベリーペイトン氏博士論文公開審査
『英語句動詞と日本語複合動詞の比較研究-第二言語習得・言語教育の視点から-』


日時:2021年8月16日(月) 13:00-17:15
会場:東京外国語大学留学生日本語教育センター1階さくらホール/zoom

審査委員
佐野洋教授(主査),望月圭子 (主任指導教員),川村大教授,投野由紀夫教授,石川慎一郎教授(神戸大学)


審査会風景(画像匿名加工済み)


2021/08/11

2021.8.11 大阪大学マルチリンガル教育センター「英語教育オンラインセミナー」講演会

表記で「コーパスを用いた英語教育の新しい展開:指導から評価まで」という題目で講演を行いました。



当日は中高の先生方を含めて約50名の参加者があり,コーパスの可能性についてお話させていただきました。


こうした総括的な内容の講演は,自分のやってきた仕事をまとめる良い機会になります。お話をまとめる準備作業の中で,別個のデータや調査間の思わぬつながりやmissing linkへの気づきがありました。



2021/08/10

2021.8.10-11 日本語教育システム支援研究会CASTEL-Jに参加

表記に参加し,発表を聴講しました。


完全オンラインでの開催でしたが,シンポ・発表・ポスターと内容も盛りだくさんで,運営もスムーズで勉強になりました。padletをプラットフォームにしたポスター発表では,多くの質疑コメントがついており,オンライン学会運営のお手本としても勉強になる点が多数ありました。


主なコーパス関係の発表メモ(文責:石川)

★ライティングの評価再考:機械と人間の役割と今後の教育支援
伊集院郁子(東京外国語大学)、小森和子(明治大学)、安高紀子(明治大学)、髙野愛子(大東文化大学)、李在鎬(早稲田大学)
・作文レベル自動判定システムj-writerの学習データにI-JASを使用(Lee&Hasebe 2020)。

★I-JAS コーパス「対話」タスクにおける接続表現の使用について-中国語・韓国語・英語母語話者と日本語母語話者を比較して-
長田涼子(テンプル大学ジャパンキャンパス)
・接続表現を学習者は過少使用するが,「そして」 「その後」 「それから」は多用

★自律型日本語学習のための単語分散表現モデルの構築
豊田哲也(東邦大学)
・日本語類語選択問題の自動生成を目指す
・分散表現(word2vec)でコーパスからベクトルを取り出す
・一般には大型コーパス利用が望ましいが,教育的目的では小さいデータを使う利点も
・wikiコーパスのデータをカテゴリ別で絞り込んだ結果,元データを5割程度削減したときに正解選択肢類似度(平均値)が最も高くなる


2021/08/08

2021.8.7-8 全国英語教育学会長野大会に参加・研究発表

表記に参加し,発表を行いました。

発表題目「学習者コーパスと産出評価:ICNALE GRAプロジェクトの狙い」



中級学習者に固定した場合,日本人作文の評価は相対的に高い。
高評価は文法面の強さが支える。弱みは読み手との関与性の構築と維持か?

開会式のお話では参加申し込み者が600名。zoomで見ていると,講演などでは,400名程度の参加がありました。これだけの人数にも関わらず運営はスムーズで,学会運営面でもいろいろと学ぶ機会が多かったです。

・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・
コーパス関係の発表のメモ(文責:石川)

★新学習指導要領下における中学生のための語彙リストの開発
佐藤 剛氏(弘前大学)
・中学教科書をコーパス化して語彙を抽出
・頻度とレンジをかけたARF(average reduced frequency)指数で調整
===================================================
Brezina (2018 p.55)よりARFについての石川メモ
・提唱者はSavicky & Hlavacova 2002
・分布度と頻度を自動で評価
・レンジに比べ,サブコーパスに分かれていなくても計算可能という利点
・v値=コーパス総語数÷ターゲット語頻度
・ARF={(ラストと1語目間距離とvの小さいほう)+(1語目と2語目間距離とvの小さいほう)+・・・(n語目・n+1語目間距離とvの小さいほう)}÷v

(計算実例)
 ・100万語コーパスで頻度5の単語AとB

・Aは近傍にかたまって出現しており,出現位置は第1(冒頭から1語目),第2(5語目),第3(10語目),第4(15語目),第5(20語目)
・単語Aのvは100万÷5=20万
・ARFの各項目値の計算
(a) ラスト出現位置(100万語中の20語目)から第1出現位置(1語目)までの距離=999,981 vs 20万のちいさいほう ★このときだけプラス1になる
(b) 第1から第2までの距離=4 vs 20万の小さいほう
(c)  第2から第3までの距離=5 vs 20万の小さいほう
(d) 第3から第4までの距離=5 vs 20万の小さいほう
(e) 第4から第5までの距離=5 vs 20万の小さいほう
・単語AのARF=(20万+4+5+5+5)÷20万=1.000095

・Bはコーパス全体にまんべんなく出現しており,出現位置は第1(1語目),第2(20万語目),第3(40万語目),第4(60万語目),第5(80万語目)
(a) ラスト出現位置(100万語中の80語目)から1語目出現位置(1語目)までの距離=200,001 vs 20万のちいさいほう
(b) 第1から第2までの距離=199,999  vs 20万の小さいほう
(c) 第2から第3までの距離=20万 vs 20万の小さいほう
(d) 第3から第4までの距離=20万 vs 20万の小さいほう
(e) 第4から第5までの距離=20万 vs 20万の小さいほう
・単語BのARF=(20万+199,999+20万+20万+20万)÷20万=4.99995

※Lancaster Stats Tools Onlineで自動計算可(使ってみたが,位置は自分で調べる必要あり。数値は整数値まで)
上の例Aを計算させたところ

上の例Bを計算させたところ

===================================================

★日本人英語学習者の英作文における後置修飾を含む名詞句構造の産出―学習者コーパスを用いた研究―
田中 広宣氏(東京大学大学院生)
・NICER1.3.2のEducationテーマの作文53本(1.6万語)をタグ付け
・to不定詞・分詞・関係代名詞が含まれるものを抽出し目視で後置修飾を探す
・A2,B1,B2にかけて,正確な産出を行った学生比率
 不定詞は23から72%へ,分詞は8%から17%へ,関係節whoは46%から72%へ,関係節whichは46%から39%へ,関係節thatは8%から11%へ
・総使用量,正確使用量ともに増加

★英語の定冠詞選択における「一般・特定」の役割分析
高橋 俊章氏(山口大学)
・NICE/NICERで質的用例検証

★発信語彙の定着を促すICT 教材―EasyConc for FlashCard.fmp12 とBingoSheet for FlashCard.xlsm の開発と活用―
日臺 滋之氏(玉川大学)
・パフォーマンス課題実施後に英語で言いたかったが言えなかった語を書いてもらう
・EasyConc(日本語表現と英語表現が対応する日英パラレル・コーパス)
・EasyConc for FlashCard.fmp12(iOS 仕様)
・BingoSheet for FlashCard.xlsm(Windows 仕様)
・言えなかった語は「行く」「好き」など基本語だがほかの語と結合してむつかしくなる

★英検難易度に基づく多義前置詞in, on, at の語義分布と出現頻度
南部 匡彦氏(国際短期大学)
・英検コーパスを自主構築
・in/on/atの語彙区分をコーディング
・in/atは似るがonは独自(抽象・句動詞多い)

★小学校英語における読むこと・書くことへの接続―検定教科書に基づく頻度分析を通して―
星野 由子氏(千葉大学)・清水 遥氏(東北学院大学)
・小学校英語教科書コーパス+リスニングスクリプトコーパスを構築
・見る頻度,聞く頻度を計量




2021/08/04

2021.8.4 Q2最終試験・評定決定

水曜クラスの試験が終了し,16週間の前期が終わりました。下記,担当する一般教養の4クラスの成績分布です。(A)Sは上位10%以内,(B)S+Aは上位40%以内というルールに抵触しないよう最終評定が決定されています。これで一山超えました。

成績分布概況(%)



2021/08/03

2021.8.3 学内科研費説明会メモ

 配布資料により,(自分関係の)ポイントを整理。

1)B/Cの場合,8/2開始,10/6締め切り(望ましい1稿完成は9月上旬ごろか?)
2)「研究目的方法(5p)」と「着想経緯(1p)」は合体
3)「挑戦」の審査観点:挑戦性・妥当性・適切性の3観点総合から,「挑戦性」「妥当・適切性」の2観点へ。(挑戦性のウェイトがあがる)
4)萌芽の審査は,1段階・2段階で同じ審査員がやることに
5)H29/3/24文科省告知「大学などにおける過度のローカルルールの改善」事務連絡