コーパス関係発表の聴講メモ(文責:石川)
(1) Reframing individual differences as intra-individual variability: Reconceptualising emotion, motivation and willingness to communicate.
Peter Macintyre (Cape Breton University)
※直接コーパス系の発表ではないが,個体と集団の関係についてのとらえ方は学習者コーパス研究に密接にかかわるもので,今回聴講した中で特に有益であった発表(石川)
1)個人差(individual difference:ID)には2つの意味
・人の体系的な違い(知能,態度,正確,同期づけ,感心)
・他人とどう違うか(inter-individual variation)/個人が時間的にどう変わっていくか(intra-individual variation)
・個人を集団に概括かできないのと同じく,集団を個人に概括化できない
・Hamaker (2012) タイプの速さと打ち間違い:集団で見れば反比例(速い人はミスも少ない),個人で見れば比例(無理に速く打つとミスが増える)
・データ合成の誤謬(Simpson's Paradox)
・答えがないとみるのではなく,答えは複数だととらえるべき
・Lowie & Verspoor (2019) differences between individuals cannot and need not be generalized beyond the individual learners we are observing
・McIntyre (2021) We must stop shamelessly discarding individual level data. Uniqueness is not a problem, it is an opportunity.
2)CDST 複雑系ダイナミックシステム理論(complex dynamic systems theory)
・システム内・システム間の相互作用に注目するメタ理論
・過程(process)を詳細に調べる研究手法
・複雑性と変化を強調する物の見方
・open 個人レベルではすべての影響を予測不可
・self-organizing システム間の相互作用に依拠。吸引子(attractor)と反発子(repeller)のゆるやかな結合
・emergent 部分ではなく,調和した意義のある全体を見る
・通常のRQ:WTCは不安に関係しているか/動機づけはL2能力を予測するか/不安は楽しみと相関するか
・CDST系のRQ:WTCは不変なのに不安度が高まっている場合何が起きているのか?/動機づけの瞬間瞬間の変化はどんな要因によるか?/不安度と楽しみ度が正比例するのはどんな場合か?
・CDSTの研究法 Lavelli, Pantoja, Hsu, Messinger, & Fogel, 2008
・変化する個人を研究対象に
・変化の前・途中・後で観察を実施
・過程の中で観察の密度をあげてゆく
・観察された行動を集約的に分析。量的・質的。発達と変化をもたらす過程そのものの具現化をゴールに設定する
・idiodynamic methodでの研究のやり方
・集団ではなく個人に焦点,communication eventsに焦点
・L2の各種コミュニケーションを記録
・その間の情意面の変化を評価するため,刺激想起インタビューstimulated recall(活動時のビデオを一緒にみながら学習者の注意や気づきに関するデータを集める)(Gass & Mackey 2000)を即時実施。関心対象(不安,動機)の変化を連続的に評価し,量的データとしてまとめる
・情意面の学習者自己評価を再検討
・すべてを書き起こして分析にかける
・WTC分析なら,そもそもあえてコミュニケーションするかしないか,言語習得で最も重要な決定
・WTC=機会をとらえ,コミュニケーションを先導(initiate)しようと選択する確率
・性格的(trait-like)傾向+瞬間瞬間で変わる状況(feeling willing)
・WTCと実際のL2使用の間にはcrossing the Rubicon
・The theoretical orientation of the pyramid model requires consideration of the here-and-now experience of WTC, even though much of the early WTC research approached it at the trait level( MacIntyre 2020, 127) ピラミッドモデルは性格レベルではなく個人の瞬間瞬間の実態でとらえるべき
(2) Gender representations of tennis players in the new media: A corpus-assisted critical discourse analytic study
Adrian Yip Queen Mary University Of London
・SNN研究ではmultimodality分析重要
・social semiotic approach
・内容分析+CDA
・ウィンブルドン2018,インスタ分析
・modality指標=彩度(color saturation)×輝度(illumination)
・女性描出のキーワードはmagical(色彩の詳細な区別と賛美系形容詞が女性の語彙選択 Lakoff 1973)
・男性選手はreal world matter,女性選手はmagical world
(3) The Dynamic Patterns of Syntactic Complexity in Chinese EFL Learners’ Writing Based on a Longitudinal Learner Corpus
Yurong Zheng Harbin Engineering University
・CLEC (Chinese learner English Corpus)(Guis Shiqun & Yang Huizhong 2003)
・SSWECCL (Spoken and Written English Corpus of Chinese Learners) (Wen et all 2005/2008)
・Verspoor et al(2008) オランダの英語学習者 3年間に18の作文。語彙複雑性(語長)と統語複雑性の変化をトラック
・中国人英語学習者対象の同様の先行研究のポイント。non-linear, dynamic, inter-individual dif, fluctuating, staged development, progression and regression
・6学期間(=3年?)の学習者79人(学力は全国平均より3-5ポイント/100 高い程度)の作文を集めた自作コーパス(11万語)で語彙的多様性を分析
・3つの語彙多様性で0田をCompleat Lexical Tutorで計算
・LD lexical density 内容語/総語数
・LV lexical variation 異なり語数の2乗/総語数
・LS lexical sophistication 上位2000語占有率,AWL率,off-list語率
・LDは微増,LVははっきり増加,top2000語率は減少,AWL率は上昇,off-list率も減少
・LD/LV相関は0.26-0.34
・2000語率はLDと-0,3,LVと-0.2から-0.5程度
(4) Interpreting patterns in corpora of L2 speech: The challenges of finding a meaningful L1 reference point
Dana Gablasova & Vaclav Brezina Lancaster University
・SLA/LCRの目的は,L2使用における体系的変異+L2習得過程および成果に体系的に影響する要因解明
・CIAではL1コーパスと比較することが多い
・CIAのためには2つのコーパスはcomparable(比較対象以外は統制)であるべきだが,コーパスの代表性問題は微妙
・発話コーパスに影響を及ぼす要因:モード,ジャンル,タスクタイプ,タスク属性(指示・時間・インタビュワートレーニング,インタビュワー数など)
・CACCODE(1138人,500万語),BNC Demo(1407人,430万),BNC2014 Spoken(376人,480万語),BNC64(64人,160万),LOCNEC(50人,12万)
・I think:BNCSP/LOCNEC>>>BNC Demo
・受け身 CANC>>>BNC Demo
・過去形 LOCNEC>>>BNC SP
・同じL1でも内容が変われば言語も変わる(結果の解釈は慎重に)
・Trinity Lancaster Corpus (L2対話,2053人,430万語)L1はスペイン,イタリア,ヒンディ中心。Presentatoin, Discussion, Interview, Conversation
・タスクタイプはstance takingに影響
・stance marking = a perspective toward (a) what is being communicated and (b) the interlocutors (Reilley et al 2005)
・関連副詞INT>PRES, 形容詞INT>PRES,動詞CONV>PRES
(5) Spoken learner corpora : diversity and comparability.
John Osborne/ Evgenia Nicol-Bakaldina University Savoie Mont Blanc
・社会的対話では意味の伝達手段は無数にあるので記録すべき文脈情報は無限で分析作業はblack holeとなる(Adlphs & Knight 2010:44)
・複雑性は上昇:独話コーパス(PAROLE corpus)<縦断コーパス(独話・発話)<教室対話(とくに初級)<CLIL授業
・PAROLEの分析から。個人差はあるが,WPMについてはNNSの最頻値は100-120,NSは90-110/ 120-180。
・CEFRとの関連付け A1(30-50), A2 (60), B1(70-80), B2(90-110), C1(120-180), ENS (130-220)
・縦断コーパスSCFLE(フランス語学習者12人)分析→個人差が大きい(A型:不変,B型:下がって持ち直す,C:上がって下がる,D:上下繰り返す)。集約してしまうとよくわからなくなるが,集団としての傾向もいくらか抽出可
・教室コーパス(パリの英語学習小学生6-8歳,40分授業3週分,1年に3回撮影,教師,学習者集団,学習者個人にわけて書き起こし)
)
・教師は1年生向けにはmodellingや引き出し質問,命令,positiveな応答確認中心だが,2年生向けになると引き出しや,単純反復が増える
・児童は1年生だと授業内の練習時間だけでターゲット語(pear, orange, chocolate)を集中使用(反復練習など),2年生になると使用機会が授業内でまんべんなく広がる
・CLIL(フランス高校,英語で学ぶ歴史クラス)16時間の授業ビデオ,教師2人,11万語
・ExMARaLDAでアノテーションしてエクセルで解析
・インプットとアウトプットの組み合わせは複層的:教師発話によるインプット→学習者Aがアウトプットする=ほかの学習者のインプットになる・・・
・10か月間のエラー量は単元内でみると上がって下がり,全体で見てもやはり上がって下がる
(6) The Effects of Explicit and Implicit Instruction on the Use of Discourse Markers in Japanese EFL Learners’ Speech
Kazunari Shimada MEXT Senior Specialist For Textbooks
・DM指導と学習者のDM使用の関係をさぐる
・大学生58人,オンライン授業,英語力はTOEIC365-500
・まず学生はQAタスク(海外どこ行きたい?)と発話タスク(友達は大事か?)で自分の発話を録音して提出(pre)
・その後教師が講義ビデオでDMを直接指導(模範解答内のDMを強調表示)+教師は個別学生にメールでフィードバック
・学生ははロールプレイタスクを実施
・教師は個別学生にメールフィードバック
・学生は絵描写タスクを実施
・教師は個別学生にメールフィードバック
・学生はQAタスクと発話タスクで自分の発話を録音して提出(post)
・教師が講義ビデオでDMを直接指導+教師は個別学生にメールでフィードバック
・pre/postと似た発話テスト(delayed)
・pre/post/delayの3段階変化(QAの場合)
・and 17--8--32
・anyway/finally 0--0--0
・because 14--11--16
・for example 0-9-0
・and because soのような簡単なものはもともと多用
・指導でfor example, how about, wellなどの使用は増える
・時間がたつとDMの多様性はへる
(7) Lexical complexity and spoken L2 English proficiency in the Trinity Lancaster Corpus
Raffaella Bottini Lancaster University
・Lexical density(内容語vs機能語)
・Lexical sophistication (上級語比率)logCW (content word)/ log FW(function word) BNC2014と比較
・Lexical diversity(異なり語分布)MTLD(TTR改良版)
・発表者はLex Complexity Tool(Bottini 投稿中)を新規に開発 各種の複雑性指標に加え,BNC2014語彙表との対照結果を表示できる
・3指標に対するL2習熟度の影響(主効果)FW(0.02) CW(0,03), MTLD (0.1)
・3指標に対するL1タイプの影響(主効果)CD(0.04) MTLD (0.02) FW(0.01)
・ともに影響は弱い
・総じていえば,習熟度があがるとMTLDとCWはあがり,FWは下がる傾向
・MTLD イタリア<スペイン<中国
・FW 中国<イタ<スペ
・CW イタ<中国<スペ
・L1が英語に近い言語(スペイン語)であるほど高頻度語を多用し,多様性の低いテキストを産出
(8) Measuring speaking fluency automatically for the purpose of research and assessment
Nivja De Jong Leiden University
・応用言語学:cognitive(思想を負荷なく言葉へ)/utterance(速く話す)/perceived fluency(相手からどう聞こえるか) (Segalowitz 2010)
・ACTFL, IELTS, TOEFLなど:pauseやslow paceといったdisfluencyの少なさを評価
・Bosker et al (2013/14)
・人手による主観評価の84%は客観指標で説明可能
・話速を人工的に変えても評価は一定
・PRAAT-script(2019) salient pauseを自動検出,発話速度も。filled pause/ repetition/ repairの自動検出には対応していない
・PRAAT script 2020を開発。従前不可だった要素にも対応
・intensity(dB)の山と底,voiced peaksで1語(シラブル)を自動検出。人手コーディングとの相関は話速で.86,articulation rateで.92
(9) Linguistic strategies for expressing stance in advanced L2 students’ critique writing: a corpus based study
Abdulwahid Al Zumor KING KHALID UNIVERSITY
・stance= personal views/ attitude/ position
・73人のサウジの大学院生の批評エッセイ(サウジにおける学習障壁),7.8万語
・Lancsbox使用
・事前に知識と使用経験を調査,booster,hedge, attitude markerはある程度既知だが,self-mentionはあまり意識的には知らない
・booster: very > clear>without>a lot...
・hedge: general> should > claim> assume > would...
・attitude :important>agree>only>fail>good...
・self-mention: I>we>my>our...
・明示的指導・トレーニングが大事
(10) Dynamic data-driven learning
Ana Frankenberg-Garcia University Of Surrey
・発見学習(discovery learning)=構成主義的教授法
・Piaget (1936) 主体的・蓄積的に新しいことを学んでいく
・Vygotsky(1978)圧倒的なタスクを与えず少しずつ足場かけ
・Johns (1991) DDLはawareness raisingに有用
・DDLの2つの方法(Gabrielatos 2005; Boulton 2010)
・the hard, hands-on way(コンコーダンサでデータを直接検索)
・the soft, hands-off way (あらかじめ教師が選んだコンコーダンスラインや単語リストを分析)
・Frankenberg-Garcia (2012, 2016):両方のアプローチは相補的
・第3の方法(dynamic approach to DDL-D-DDL)を提案:ミニデータ(just-in-timeを検索体験させる(hands-on)が,複雑なソフトで大量の言語データを扱わせることはしない(hands-off)
・2つのシステムを利用
・ColloCaid (www.collocaid.uk)(Frankenberg-Garcia et al. 2019) 英文を入力すると主要語にポップアップが出てよくあるコロケーションを示す。必要な場合は画面上で修正可能
・コベントリ大学が運営するBAWE QuicklinksEnglish(British Academic Spoken English Corpus, 英国の優良学生エッセイ,650万語,Sketch Engineで公開):入力語に対してBAWEからの用例を表示する。教師が校閲に使ったデータセットをencyclopediaとして共有(例:学生がsupport that SVと書いたがコーパスではsupportの目的語は名詞であった,など)
石川補足
collocaid(上記では入力した英文中のusingに対して,
widely use,use for など高頻度のコロケーションが提案されている。
※入力した英文の文脈に応じたuseのコロケーションではなく,
単にuseの取りうるコロケーションをリストする)
bawe quick link(作文中のよくある誤用例についてコーパス用例を示す)
(11) Corpus-driven Approach of English Vocabulary Learning at Chinese Tertiary Level Program
Dr. Yurong Zheng (Harbin Engineering University)
・大学で「English Lexicology」という授業を担当(単語の基礎概念,語彙発達,形態的構造,語形成,語の意味,イディオム,辞書など)
・ RIPEモデル: resource-providing, information-inputting, paradigm-setting and evaluation-enhancing(資料配布,情報提示,データ分析枠組み指導,評価改善)
・資料配布ではCOCA, COHA, CLEC (100万語の中国人学習者コーパス),自作の縦断学習者コーパス,オンラインの新語辞典(wordspy.com)や語彙サイト(lextutor)を併用
・情報付与では,語形成や単語の意味変化を解説
・分析枠組みとして「on-line/onlineの意味の差」や「nessとityの生産性」などのテーマを与え,頻度・コンコーダンスなどを指導して練習させる
・評価として,形成的評価を採用(評定の6割):討論,発表,レポート
・質問紙とインタビューで受講学生の評価を調査:好反応
(12) Learning L2 Non-Congruent Collocations: The Effect of a Corpus-assisted Contrastive Analysis and Translation Approach
Dr. Rezan Alharbi (King Saud University)
・Non-congruent collocations (L1にないコロケーション):習得・使用・理解ともに困難
・NCコロケーションの習得を促進する環境の解明は不十分
・言語対照(L1/L2翻訳)が有用? コーパス活用が有用?
・DDL(実物性・没入性・学習者自主性)
・CAT(L1/L2 contrastive analysis+translation)(認知面,語彙転移,バイリンガルメンタルレキシコン表象,語彙習得の心理学的モデル,翻訳)
・両方を組み合わせて実験実施
・サウジ学習者129人が,30種のNC型コロケーション(形容詞+名詞)を習得
・3条件(コーパスなし言語対照あり/コーパスあり言語対照あり/コーパスあり言語対照なし/統制)
・プレテスト(能動的想起,受動的想起)
・6セッションでターゲットの学習
・直後ポストテスト,3週間の遅延ポスト
・コーパスあり言語対照あり学習群が最高値
(13) Direct and Indirect Data-Driven Learning: Affordances and Constraints
Xiaoya Sun (Nanyang Technological University)
・DDL隆盛(Gilguin & Granger, 2010)
・直接アプローチと間接アプローチ(Boulton 2017)
・にもかかわらず教師はDDLと言えば直接DDLだけと思い込み,それを手間と感じるため教授法の主流になっていない
・中国人学習者のヘッジ習得について,直接DDLと間接DDLの効果を比較
・共通事前学習
(a) MICUSPからヘッジあり文と人工的にヘッジを抜いた文を組み合わせてハンドアウトとして配布,学習者ペアに2文を比較させる(容認性判断,容認性を高める言語的工夫を探す,それらの形式的特徴を書き出す)
(b) ヘッジの機能別リストを配布
・直接DDL組(MICUSPで知らないヘッジを探し,コンコーダンス機能で意味と用法を推測させる,任意の3つのヘッジを選び,ICNALEの中国人作文とNS作文で比較させる,ICNALEの中国人・NS作文を1つずつ選び使われているヘッジを調べる,MICUSPの上級作文からヘッジをうまく使っている段落を探させる)
・間接DDL組(知らないヘッジの意味探しを辞書を引いて行う,その後,ヘッジを抜いたMICUSP用例のプリントをもらい空欄を埋める,原文のヘッジと比較,自分の過去作文のヘッジを修正)
・直接群のヘッジ使用量はpre/post/dpで27--36--31,間接群は32--48--39
・間接群のほうが効果高い
・学習者アンケートでは直接群はコーパスが役立つと述べたがコーパスが辞書より有益だという点については懐疑的,間接群は指導が役立ったと述懐
(14) Corpora in interaction: A conversational study of Data-Driven Learning interactions with the FLEURON database
Dr. Biagio Ursi (Aix-Marseille University)
・DDLは英語以外にも効果
・学習者はFLEURONデータベース(石川注:French as a Foreign Language at University: Digital Resources and Tools)(https://fleuron.atilf.fr/)内のAudio Visualコーパスをコンコーダンサで分析
・仏語学習者と教師のやりとりをマルチモーダル(視線,ジェスチャー,姿勢)データとして分析(会話分析的)
FleuronHPより使用可能なフランス語ビデオ資料の例