このブログを検索

2021/12/26

2021.12.26 学習者コーパス研究会に参加

下記に参加しました(オンライン)


■ 日時:12月26日(日)14:00~16:00(日本時間)

■ 発表内容

14:05-14:20 丸山岳彦(専修大学・国立国語研究所)「日本語コーパスの展開と学習者コーパスの役割」
14:20-14:50 松隈杏梨(専修大学文学部日本語学科 4年)「JSL児童生徒の接続詞使用における課題 ―I-JAS学習環境別データの分析と調査の実施から―」
14:50-15:20 島崎英香(専修大学大学院文学研究科 博士2年)「話し言葉と書き言葉から見た日本語学習者の副詞の使用実態 ―場面別副詞語彙リスト作成のために―」
15:20-15:40 丸山岳彦(専修大学・国立国語研究所)「日本語学習者の非流暢性」
15:45-16:00 全体討議

・・・・・・・

専修大の丸山先生とゼミの学生さんの報告を聴講しました。いずれも問題設定が明確で参考になる点が非常に多かったです。とくに,松隈氏の発表では,日本の小学校でデータを独自に取得してI-JASとの対照を行っており,同様のデータ収集の必要性を強く感じました。学習者コーパスでは比較対象となるNSデータをどう取るかが課題になりますが,L2学習期間という点で考え,大人ではなくあえてNSの子供の産出を取ってみるという発想は注目に値します。

また,前回の研究会で話題になった「中間言語」と習熟度の関係について会の主宰の迫田先生から報告があり,やはり少なくとも日本語教育では中間言語=上級者という含意はないだろうということでした。この点,自分でもさらに調査をしてみたいと思います。


個人メモ
Nordquist (2019)のまとめより

"[Interlanguage] reflects the learner's evolving system of rules, and results from a variety of processes, including the influence of the first language ('transfer'), contrastive interference from the target language, and the overgeneralization of newly encountered rules." (David Crystal, "A Dictionary of Linguistics and Phonetics")
★Crystalの定義:中間言語=発展し続ける(evolving)システム

"The process of learning a second language (L2) is characteristically non-linear and fragmentary, marked by a mixed landscape of rapid progression in certain areas but slow movement, incubation, or even permanent stagnation in others. Such a process results in a linguistic system known as 'interlanguage' (Selinker, 1972)
★Selinkerの言及:中間言語=非連続的・断片的・分野によって発達速度が異なる

Noddquistの解説
In the earliest conception (Corder, 1967; Nemser, 1971; Selinker, 1972), interlanguage is metaphorically a halfway house between the first language (L1) and the TL, hence 'inter.' The L1 is purportedly the source language that provides the initial building materials to be gradually blended with materials taken from the TL, resulting in new forms that are neither in the L1 nor in the TL.
★当初の定義=中間言語:L1でもTLでもないnew form 

This conception, though lacking in sophistication in the view of many contemporary L2 researchers, identifies a defining characteristic of L2 learning, initially known as 'fossilization' (Selinker, 1972) and later on broadly referred to as 'incompleteness' (Schachter, 1988, 1996), relative to the ideal version of a monolingual native speaker.
★ここから化石化,不完全性の概念が出てくる


※石川の整理(暫定)
当初は上達するがやがて必ず途中で止まる,のが中間言語
ゆえに変化中の状態をを中間言語研究として扱うことは可能だが,通常は,行き止まりまで行きついたものを調べるほうが研究上の利点が多い(ということか?)

2021/12/19

2021.12.19 東京外大川口教授科研研究会

第2回研究会 学習者コーパス分析Ⅱ:音声認識から談話標識まで
日時:2021年12月19日(日) 12:00~16:50
形式:ZOOM会議による開催

【研究発表】

・AIによるトルコ語のテキスト読み上げと自由会話の音声認識―トルコ語母語話者と日本語母語話者の場合―
梅野毅(東京外国語大学)、川口裕司(東京外国語大学)

・ L2日本語のアクセント産出に影響を与える要因の検討
布村猛(山梨大学)、阿部新(東京外国語大学)、川口裕司(東京外国語大学)  

・フランス語学習者と母語話者の話し言葉-コロケーションのケーススタディ
バルカ・コランタン(東京外国語大学博士後期課程)、ドゥテ・シルヴァン(早稲田大学)、川口裕司(東京外国語大学)

・フランス語における談話標識 « bon » と « ben » - 地域・用法・個人の差異に着目して -
清宮貴雅(東京外国語大学博士後期課程)、大河原香穂(東京外国語大学博士後期課程)、川口裕司(東京外国語大学)

・日本語を母語とするフランス語学習者の[i]の前の[t], [s], [ʃ]の発音
伊藤玲子(東京外国語大学博士後期課程)、川口裕司(東京外国語大学)

【講演】

中間言語の視点からみるTUFS-KANDA英語モジュール「アジア英語版」の特殊性
矢頭 典枝(神田外語大学)


・・・・・

主たる関心対象言語は異なるものの,学習者コーパスの分析手法や問題へのアプローチには共通する問題が多く,大変勉強になる1日であった。アクセントを含めた音声面の研究は,ICNALEではほとんどできていないので,このあたり,詳しい人に入ってもらってデータの活用の幅を広げる必要性を感じた。



 


2021/12/11

2021.12.11 日英言語文化学会理事会・定例研究会に参加

第 78 回定例研究会
日時:2021 年 12 月 11 日(土) 14:30-18:00
Zoom にて開催


14:40-15:10
研究発表 1「質と量は両立するのか」
小西瑛子 (帝京科学大学非常勤講師)

15:15-15:45
研究発表 2「ニューラル機械翻訳と既存の英語教育の継続性」
瀬上和典(東京工業大学非常勤講師)

15:55-16:55 講演
「英語教育と日本の国際化の課題;女性活躍の視点から」
橋本ヒロ子(十文字学園女子大学名誉教授、国連ウィメン日本協会理事)


聴講メモ

瀬上先生の発表は,最近関心を持っているテーマと重なり,有益だった。よくある自動翻訳の技術紹介といった内容ではなく,機械翻訳の背後にある哲学的・理念的な問題を掘り起こした内容であった。


2021/12/04

2021.12.4 Asia TEFLで発表

Asia TEFL 2021はインドのホストで開催。 ICNALEのrating data分析について報告。


演題:Linguistic Features of "good" essays and "not so good essays"


「良い作文」の特性抽出の例


●参加メモ

コロナ禍の影響はあったとはいえ,今回のAsiaTEFLは,CFPの段階以来,トラブルの絶えない学会だった。

まず,発表申し込みの受付システムの問題で,発表者とタイトルが紐づけできないケースが多発。最後は,タイトルのみウェブに浮かべて,「これが私のものだと思えば連絡せよ」という告知が出るに至る。

また,会費の支払いシステムも問題が多発。会費の支払い証明をアップロードするところでシステムにはねられる事例が多く起こる。

その後,発表ビデオを事前に指定先に送ることになるが,上記同様,アップロードシステムの問題で,アップロードできない事例が多発。

上記の影響か,本来事前に公開されるはずの発表ビデオのリンクはついに最後まで参加者に公開されず,オンライン会議の正規の時間にその場で再生されることに。

また,再生は運営委員会管轄となったが,時間の管理が甘く,人によっていきなり2倍速で再生されたり,とかなり混乱が起こる。質疑の時間は(急遽当日の告知で)数人まとめて一括方式になったため,そこに発表者がおらず,結局質疑カットという事例も。。。

あわせて,これも開会前に配られるはずのアブストブックの編集が間に合わず,大会が終わってからオンラインで刊行された・・・


対面の場合,現地の感動や,人とのふれあいなど,リアルな体験のインパクトが大きいので,大会運用上の小さなミスがあっても全体的な参加者の満足感は高まりやすいが,オンライン学会だと,大会の中身(発表・質疑・講演)だけでシビアに評価されることになるので,運営側の責任はより大きくなる。いくつかのオンライン学会に関わってきた身として,他山の石としたい。



2021/11/30

2021.11.30 国立国語研究所セミナー参加(オンライン)

下記を聴講しました。

第231回NINJALサロン
2021年11月30日

浅原 正幸 (コーパス開発センター 教授)

「「過去」「未来」を主題にした作文の分析 ―教育基本語彙 増補改訂版との対照分析―」 


メモ

言語における時間をテーマにした大型科研の研究成果の一部。英語の学習者コーパス研究にも応用できる興味深い内容。ただ,過去をテーマにした作文,未来をテーマにした作文,というのは,意外に定義がむつかしそう。「2050年,未来の自動車はすべて電気になっているだろう。そもそも翻ってみると,自動車の誕生は18世紀のフランスとされ,爾来・・・」のような感じだと,書き出しは未来だけれど,作文の大半は過去について書いている,ということもあるかもしれない。テーマ(トピック)の統制の難しさはすべてのコーパス研究に共通する。

2021/11/25

2021.11.25 兵庫県立津名高等学校インスパイア―事業特別講演

この数年,毎年2回ずつ伺っている津名高校での講演です。地域活性化をテーマにした生徒さんの発表を聴講し,コメントと講話を行いました。堂々とした発表で,今後の生徒さんのさらなる成長が楽しみです。

会場


往路は,JRから高速バスに乗り換える舞子で少し時間があったので,淡路海峡大橋を上から見られる「舞子海上プロムナード」を少し覗いてきました。

橋の下は海。わかっていても結構怖い。

淡路からの帰路はちょうど夕方の時刻になり,いつもながらの舞子の美しい夕焼けが見られます。年2回,この光景を見るのが本当に楽しみです。はるばる海外まで行かなくとも,絶景はすぐそばにあるな,と実感。

舞子から淡路方面を望む。




2021/11/23

2021.11.23 英語コーパス学会役員会参加

表記に参加。主な議題は,2022年の大会開催形態について。現状は感染者数も落ち着いており,この状況なら2022年10月の対面開催は大丈夫そうな気もしますが,コロナ禍になって学んだのは先がまったく読めないということ。学会の場合,直前の開催形態の変更はリスクを伴う判断となり,どちらでいくか悩ましいところです。どこの学会も同じ悩みを抱えているところかと思いますが。。。

 

2021/11/19

2021.11.19 ランカスター大学Introducing the Written British National Corpus BNC2014シンポジウム参加(オンライン)

表記イベントに参加しました。2年前に訪問したランカスター大学やランカスターの古城の風景が随所に出てきて,懐かしいひと時でもありました。新しい実証的な英語研究を強力に駆動するすばらしい言語資源がリリースされたことを,同じ分野の一人として本当にうれしく思います。

Brezina氏講演

McEnery氏講演

Programme

12.00-12.30 Online programme: Lancaster Corpus Linguistics

12.30 – 12.45 Vaclav Brezina (Lancaster University): Welcome and Introduction to the event

12.45 – 12.50 Elena Semino (Lancaster University): Welcome from the Director of The ESRC Centre for Corpus Approaches to Social Science (CASS)

12.50 – 12.55 Paul Connolly (Lancaster University): Welcome from the Dean of Faculty of Arts and Social Sciences (FASS)

12.55-13.00 Break

13.00 – 13.15 Tony McEnery (Lancaster University): The idea of the written BNC2014

13.15 – 13.30 Dawn Knight (Cardiff University): Building a National Corpus:  The story of the National Corpus of Contemporary Welsh

13.30 – 13.45 Vaclav Brezina (Lancaster University): Current British English

13.45 – 14.00 Vaclav Brezina and William Platt (Lancaster University): Exploring the BNC2014 using #LancsBox X

14.00 – 14.15 Randi Reppen (Northern Arizona University): Corpora in the classroom

14.15 – 14.30 Alice Deignan (University of Leeds): Corpora in education

14.30-14.45 Dana Gablasova (Lancaster University): Corpus for schools

14.45 – 15.00 Bas Aarts (University College London): Plonker of a politician NPs

15.00 – 15.15 Break

15.15-15.30 Marc Alexander (University of Glasgow): British English: A historical perspective

15.30 -15.45 Michaela Mahlberg (University of Birmingham): Corpora and fiction

15.45 – 16.00 Martin Wynne (University of Oxford): CLARIN – corpora, corpus tools and collaboration


 ※BNC2014関係のVaclav Brezina & Tony McEnery先生講演メモ(文責:石川)

・88171ファイル,8ジャンル(52サブジャンル),構築に7年間
・地域的,社会的,現使用域の変種を網羅,バランスを改善,言語変化と社会変化を反映,版権処理,1994版に従いつつも間違いは修正
・BNCをupdate,originalを改良,現在のイギリス英語を記録,サンプリングの問題を改善,統計を洗練(LancsBox),無償公開,新しい電子コミュニケーションへの配慮
・ジャンル比率の変更
  学術 16.5%→20%
  小説16.6%→20%
  新聞9.6%→20%
  雑誌7.6%→15%
  E言語0.2%→5%
  そのほか39.5%→10%
  話し言葉10%→10%
・データは2010~2020年。そのうち2014-16で72%とターゲット年への集約が高い。
・旧版は1960-1984で630万語,1985-1993で7900万語など,幅が広く,一般の理解とは別に,「1994年の英語」や「1990年代初頭の英語」の代表になっていなかった

・1994/2014の3つの変化: informal化,e言語増大,法助動詞の減少
・(1)  informal化:don't などの縮約は学術分野でも+28%
・(2) e言語増大:Alexa, (software→)App, Blog, Congratsなど,ウェブ関連語やウェブ特有の使い方
・(3) 法助動詞減少:must ▲42%(減少率はFLOB/ BE06とほぼ同じ) may ▲40%  shall ▲60%
・統計分析によるジャンル特性の再検証(※はっきり述べていなかったがおそらくMD法)
・involved(縮約,代名詞,私秘動詞,強調emphatic) vs informational(長い語,名詞) 
Informal Speech---TV--EL(SMS)---EL(Forum)---EL(Email)--Fiction---EL(Review)---EL(social)---EL(blog)---Hansard---Magazines---Academic Hum --- News Mass --- Academic PLE --- News Serious ---- Academic Soc --- News Regional --- Academic Tec --- Academic Natural ----Academic Medial --- Business Reports

★要約すると,Involved---くだけた発話---各種ネット言語--ブログ---雑誌---学術&新聞---Informationalという階層性。
・ネット言語はくだけた発話に近い。ブログはネット言語でありながら,雑誌などと同じフォーマリティを持つ。新聞はAcademicと近いかたさを持つ。

※感想
「現代イギリス英語」の精華であるBNCの2014のリリース発表をチェコ出身のBrezina氏が語る・・・ 研究のグローバル化と国境を超えるコーパス研究の可能性を強く感じるシンポだった。ひるがえって日本の日本語研究に同様の将来は来るだろうか?




2021/11/04

2021.11.04 電気通信大「イノベーティブ理工系英語教育研究ステーション第24回研究会」で講演

イノベーティブ理工系英語教育研究ステーション第24回研究会

The 24th Research Seminar of the Research Station for Innovative & Global Tertiary English Education (IGTEE), UEC Tokyo

【日時】令和3年11月4日(木)(Nov. 4, 2021, Thursday) 16:15 - 17:45 

【ZOOM MEETING】(申し込みフォームを参照)

Title: Corpora and Word Lists: How to Choose Academic Words

Presenter: Shin'ichiro Ishikawa    Kobe University

Abstract:

Corpora have been widely utilized for compilation of varied types of word lists. In this talk, I will briefly touch upon the history of corpus-based word lists. Then, I will introduce two kinds of recently developed wordlists: New JACET8000 (JACET, 2016) and BABILON2000 (Ishikawa, 2018). New JACET8000 is a general-purpose word list designed for college students in Japan. It is based on the frequency data from the British National Corpus (BNC), Corpus of  Contemporary American English (COCA), and a set of supplementary corpora including the texts that Japanese students are likely to encounter in the near future. Meanwhile, BABILON2000, which is intended to expand the Academic Word List (Coxhead, 2000), is a list of high-frequency and high-coverage academic words chosen on the basis of six key principles: BAlanced, Broad, Integrated, Lemma-based, and OpeN.


講演資料より

 

2021/11/02

2021.11.02 第1回中高生データサイエンスコンテスト表彰式

学長室で開催された表記イベントにオンライン参加し,最後に審査員として短い講話を行いました。最優秀賞の兵庫県立小野高校ほか,受賞校のみなさん,おめでとうございます。


表彰式(Zoom中継)

講評スライド


2021/10/28

2021.10.28 神戸大学史特別展「大正時代の神戸大学-100年前の学生たちの青春譜-」観覧

本日初日の表記展覧会を観覧しました。



母校として6年間,勤務先として20年近くかかわっている学校なので,わりといろいろ知っているつもりでしたが,今回も新発見がありました。

それは英語辞書史で重要な意味を持つ竹原常太先生(1879-1947)の「スタンダード和英辞典」と神戸大の関係についての展示でした。

展示物より

竹原先生は神戸大(神戸商業大学)の教授でしたが,先生の出された「スタンダード和英大辞典」は当時としては画期的な生の用例を集めて作られた辞書です。また,後に出た「スタンダード英和辞典」には,ソーンダイクに基づく頻度も掲載されています。

展示では,スタンダード和英の出版計画が出版社の経済的事情で行き詰まり,神戸大の創設者?とされる当時の学長が出資を呼び掛けて,なんとか私費出版で刊行にこぎつけたことが資料とともに紹介されていました。

出資承諾書(展示品より)

改めて竹原先生の業績を振り返るとき,生の用例の収集(これって要はコーパスですね),辞書の作成,語彙頻度研究,さらには科学的な英語教育研究・・・と書き出してみれば,今の自分の仕事と非常に重なることに驚きます(日本の英語研究史に名を遺す偉大な先輩教員と比較するのは厚顔無恥ではありますが)。

神戸大が英語辞書研究・語彙研究の拠点であったというイメージは私にすらほとんどなかったのですが,竹原先生を教授として擁し,また,南出康世先生を輩出したことを思えば,神戸大は,フィロロジー的な言語研究の伝統をもっと大事にすべきではないかと感じます。






 

2021/10/23

2021.10.23 学習者コーパス研究会を聴講

学習者コーパス(I-JAS)研究会(2021/10/23)

■ 日時:10月23日(土)10:00~12:00(日本時間)

■ 発表内容

1)佐々木藍子(東京学芸大学大学院連合学校教育学研究科(配置校:横浜国立大学))
「日本語を第二言語とする学習者の接続助詞「から」の接続形式の発達過程―発達過程で見られる非規範的な使用の要因―」

2)大神智春(九州大学留学生センター)
「日本語学習者による多義語コロケーションの習得」


どちらも勉強になる発表でした。また,終了後の茶話会も盛り上がりました。石川からの問題提起。(最近私が考えていることです)

・たとえばN4やN3の学習者の中間言語というものは措定できるか?

・中間言語は習得の極致の姿か否か?

・欧州の学習者コーパス研究が(建前としては)初級データを見ないことをどう考えるか?

・Chomskyモデルをどこまで前提として習得を考えるのか?

2021/10/22

2021.10.22 DXセミナーで講演

各社の管理職さんを集めた「ミドルマネジメント向けDXセミナー」で講演を行いました。


「ミドルマネジメント向けDXセミナー」
【開 催 日】2021年10月8日、15日、22日、29日(全4回)(各回金曜 18:00~19:30)
【会     場】オンライン(zoom)
【受講対象】企業や自治体でDXを活用して事業の効率化やイノベーションを企画する立場の職員・社員(部長・課長・係長クラス)


第3回    10月22日(金) 18:00-19:30 コミュニケーション分野 「言語情報の有効活用!」

 ・コーパス言語データからの情報抽出 [神戸大学 大学教育推進機構 石川 慎一郎 教授 ] ・言語データの分類と関連データの発見 [神戸大学大学院工学研究科 白石 善明 准教授]

【主催】 一般社団法人 デジタルトランスフォーメーション研究機構(RIDX)
【共催】 神戸大学 数理・データサイエンスセンター
【後援】    公益財団法人 新産業創造研究機構・神戸商工会議所


講演会ポスターより
 
当日の発表スライドより


当日は,言語処理の基本についてまとめた後,User Localというテキストマイニングプラットフォームを紹介し,amazonのレビュー(2社の炭酸水)を使ってデータを収集する手法と応用可能性についてお話しました。仕事柄,いろいろなところに出かけて話しますが,言語学は文系と思われているためか,企業の方に話す機会はこれまでなかったので,いろいろ勉強になりました。


2021/10/20

2021.10.20 京都光華中学校高等学校探究講演

先生方向けに探究指導の講演を行いました。

演題:教師のための探究指導入門ー生徒の資質を伸ばす指導ー



最初は先生方にとっても戸惑いが大きいと思いますが,探究はうまく学校に入れば,(部活指導に代わる/と並ぶ)教師の新たなやりがいともなります。先生方には楽しんでやっていただきたいですね。

2021/10/16

2021.10.16 計量国語学会理事会参加

理事会では,石川がとりまとめをしていた論文賞規程の審議がありました。新しい賞が学会の活性化につながればと思います。

・・・・・・・・

私は,大学英語教育学会(JACET),英語コーパス学会,計量国語学会の3つの学会で,学会賞(的なもの)の規程づくりの仕事を担当させていただきました。学会賞の定義や運用には,どの学会でも同じような問題があります。メモとして。


学会賞規程を作る際の論点リスト(石川私見)

・人に出すのか,業績に出すのか?

・単一業績に出すのか,複数業績でもいいのか?

・年限(過去2年以内に刊行された・・・等)は設けるか,設けないか,設けるならどこまでか?

・単著に限るのか,共著も認めるのか? 

・共著(共同研究)を認める場合,

 (a) 筆頭だけか2番目以降も可か? 
   (b) 非会員が入っていても可か?
 (c) 指導教員などとの共著も可か?
 (d) 本人の貢献度をどうやって確認するのか?

・著書と論文に限るのか,それ以外(言語資料,ツール,実践・・・)も含むのか?

・同一人物に重複授賞できるのか,できないのか?


2021/10/11

2021.10.11-12 LCR Grad Conferenceに参加・司会

ベルギーに本拠を置く国際学習者コーパス学会(Learner Corpus Association)が提携して初開催された表記大会 (The Graduate Student Conference in Learner Corpus Research 2021)に出席し,1セッションの司会を担当しました。欧州の若い院生さんの発表に刺激を受けました。

石川担当のセッション

また,初日のSylviane Granger氏の講演も,LCRの歴史を振り返り,今後を展望するうえで有意義でした。


Granger先生講演視聴メモ(石川)
※ハンドアウトなしの講演だったので走り書きです。聞き違いあるかもしれません。

●LCRの起こり
・Granger氏,1990s後半にCLから着想
・当時のCLには,diatypic(genre)/ temporal/ geographical varietiesは考慮されていたが,学習者は入っていなかった。この状況は"unfair"(NNSのほうが多い)
・AILAでLeechに会い,LeechからICAME(1990)に誘われる
・その後,GreenbaumのICEプロジェクトとかかわる。ICLEはICEのサブデータとして始まった。
・ICLE(Granger 1993)に加え,HKUST (Milton & Tsang 1993),Longman Corpusなどが構築される。

●初期LCRの特徴
・目的は2つ(SLAの理論研究+教育実践)
・L1影響研究(大半はmono-L1 corpusだった),対照研究,誤用研究に焦点
・学生作文の特性を示す量的モデルの不足 (Milton & Tsang)
・CIA (Granger 1993),Computer-aided Error Analysis (CEA)(Granger)

●LCRの現在
・学問分野としてのLCRの確立。雑誌+ハンドブック(CUP)+学会組織+大会(2001~)
・英語以外の学習者コーパスも(言語を超えた一般化可能性を議論可)
・方法論の精緻化:CIA/CEAは,SLAからの批判を受けてさらに発展。批判は耳に痛いがそれが内省の契機となる。
・主な批判の論点,comparative fallacy(Bley-Vroman 1983)比較すると中間言語をそれ自身として見られない/古いCAの回顧版(reminiscent)
・CIA→Granger (2015) CIA2 :ENS/NNSとも,多様性を配慮(学習者はProficiency Levelやexposure量など)
・CEA→多層システムInterlanguage Annotation(教育学と言語理論の両面を意識したエラータグ Lozano & DiazNegrill 2013)Full error tagging vs Problem-oriented error ragging  習熟度ごとの学習者が出会うエラーを示す
・統計の精緻化:初期はカイ二乗(χ2)。LCRのcrudeな統計の使い方に批判。Durrant & Schmitt (2009)NS/NNSをかたまりで比較して個人差を無視。効果量を示さないなど。その後,"statistical turn" in CL in general and LCR in particular
・関心対象の広がり:Granger 1998で扱った文法(補語,POS)・語彙(高頻度動詞)・談話とレトリックなどは今も研究される。加えて,phraseologyがflagship locus of research(理論と実践のbridge。SLAのusage-basedの考えかたとも関連。インプット頻度とsaliency)。複雑性・洗練性の新しい指標。
・結果の解釈:strong on description but weak on interpretationという批判。しかし記述は重要。thorough in-depth description of key linguistic phenomena はLCRの強み。影響原因は多種多様のはずなのにL1に集中しすぎてきた。
・教育応用:LCR準拠教材はなお少ない。many pedagogical implications but few up-and running pedagogical applications。単一母語学習者コーパスに基づく特定母語話者用教材だとマーケットが小さい。出版社はgeneric one-size-fits-all なものがほしい。Granger & Paquot 2015(各種母語話者用の汎用無料教材)テスティングへの活用も期待大きい(学習者コーパスから錯乱肢を抽出するなど)

●LCRの未来
・当初の2つの目的に戻る(SLA理論+実践) CAFの新しい習熟度指標作りなど。
・cross-sectional pseudo longitudinal分析
・適性・動機付け・教材などの影響も考えるべきだが(Moller 2017), L1影響のさらなる追求も。
・Integrated contrastive analysis model (Grange 1996): 2言語コーパス+学習者コーパス。 Jarvis (2000)4種の証拠。多種のL1背景を持つ学習者コーパス分析を通して,より厳格にL1影響を調査。
・統計と言語学の良いバランスを。Larsson Egbert Biber (forthcoming) 2009-19のCL論文を調査。統計研究が増えてテキスト分析が減る。用例こそが命。
・LCR/SLAの統合には努力してきたが,LCR/FLTの融合にはさらなる努力を。
・エラー研究を再興する: ELFではerrorもfeature/ innovationとみなされ,errorはstigmatizedされるが,"Errors matter" L1別のおかしやすいエラー一覧表は有意義。Swan & Smith 1987の仕事をLCRで拡充するなど。
・ELFとの関係: ELFもproficiencyを重視。どの点でerrorがfeatureになるのか? normなしでどうやって議論するか?中国のELFとヨーロッパのELFは違う。intelligible かどうかを決めるのはほぼ不可能。前置詞はattended at X だと問題ないが,look at / forは大事。どこで線を引くのか? error annotationでは教師が大事だと思うところに注目すべき。知ることは重要。


2021/10/04

2021.10.4 神戸大数理DSセンター主催 中高生データサイエンスコンテスト審査会

 私の所属している神戸大数理データサイエンスセンターでは,中等教育との連携も積極的にやっており,表記のコンテストを実施しました。

コンテスト募集要項

当日は一次審査を通過した作品に対する審査委員会に出席しました。日頃からかかわっている大学生用の統計教育と,高校生用の探究教育の接点ともいえる今回のイベント,審査も大いに楽しみました。こうしたスキルは今後の学生にとって必須のものとなっていくでしょう。


2021/10/01

2021.10.1 後期スタート

後期がスタートしました。神戸大は対面・遠隔併存ですが,発声が必要となる学部の語学の授業,また,来日できない学生がいる大学院の授業とも,残念ながら,前期に続いて,遠隔オンデマンド形式での実施です。

また,本日付けで,3名の研究生が大学院のゼミに入りました。これでゼミ生は8名となります。当ゼミとしてはおそらくは過去最大数で,同時には見られないため,現在は,週3日,M2/ D3/ 研究生にわけて3回のゼミを実施中です。さすがにいつまでもこれでは持たないですが,3月に4名が修了予定なので,この半年の山を越えれば少し楽になりそうです。修了学年の学生さんにとっては,残り半年。悔いの残らないよう,良い論文を書きあげてほしいです。

ゼミ顔合わせ(※名前などの匿名加工処理済み)


2021.10.1-2 英語コーパス学会前夜祭・大会をホスト・発表

表記学会をホストし,発表を行いました。

発表題目:「1961^2021日本語小説コーパス」の構築:日英対照小説研究の新しい可能性



今回の大会は発表数が27本と,英語コーパス学会としては過去最大のものとなり,オンライン大会ではありましたが,参加者数は160名を超えました。本格的なオンライン大会のホストは初めての経験でしたが,おかげさまで大過なく終了することができました。しかし,オンラインで参加者が160名,対面で50名程度だとすると,学会の大会はどちらで実施するのがよいのか悩ましいところではあります。


2021/09/28

2021.09.28 兵庫県立神戸甲北高等学校探究講演

表記で探究活動にかかる講演・講話を行いました。前半は代表生徒3名の発表を聞いて講評,後半は各クラスを回っての指導となりました。


前半は,学年全員を講堂に入れることを避けるため(感染対策),発表生徒,司会生徒と,わたしだけが別の教室に入り,その様子をTeamsで各クラスに中継するという方式でした。自分が画面に映っているのかどうか,声がどう聞こえているのか,確認できないので,いささか不安でしたが,おおむねうまくいったようで,高校の先生方の工夫に脱帽です。また,司会進行を生徒が務める点も甲北のいつもの良さだなと感じました。


今年の学年は,多くの生徒が文理問わず実験にまで挑戦しており,感心しました。今後は,私がいつも言っている「4つのCと1つのE」つまり,Count, Compare, Consult, Collect, Experiment の要素をうまく盛り込んで,良い最終研究にしあげていただけたらと思います。完成が楽しみです!





 

2021/09/21

2021.9.21 ゼミ生論文が「計量国語学」に採択

ゼミ生の鄧琪さん(D3)の論文が,計量国語学会会誌「計量国語学」に採択されました。厳しい審査を経ての採択,自分のことのようにうれしいです!

鄧琪:「漢語名詞の連体修飾用法」

※安定なXX,安定のXX,の使い分けのルールは母語話者でもはっきりしません。この問題にコーパスと統計を用いて挑戦した意欲作です。


計量国語学33(2)の表紙





 

2021/09/20

2021.9.20 英語コーパス学会役員会参加

オンライン開催された役員会に出席しました。懸案事項が議決でき,ほっと一息です。

私の任期もあと半年となりました。かなりヨレヨレですが,残された期間,次の世代の研究者のために最善を尽くしたいと改めて感じました。

2021/09/18

2021.9.18 計量国語学会第65回大会(オンライン)に参加

表記に参加し,一部セッションの座長を務めました。


研究発表(一) 座長: 高田 智和

10:30 - 11:00 専門文書内のわかりにくい文の推定 − 多文化共生社会に向けたライティング支援のための考察 − 大崎 健一

11:00 - 11:30 ツリー構造からみた中国人日本語学習者の意見文の文章構造 前川 孝子

11:30 - 12:00 呉音漢音混読現象の中世における展開 − 『色葉字類抄』と『日葡辞書』の漢語語形の比較 − 大島 英之


研究発表(二) 座長: 柏野 和佳子

13:00 - 13:30 カタカナ語「ソフト」の形容動詞への成立過程について − 類義語の「柔軟な」「やわらかな」との比較から − 陳 暁静

13:30 - 14:00 J-POPの歌詞における二重表記の使用実態と変化 胡 佳芮

14:00 - 14:30 「てくる」「てゆく」「ている」に前接する動詞の種類 − アスペクトによる動詞の種類 − ベリナ タイル


研究発表(三)  座長: 石川 慎一郎

14:40 - 15:10『分類語彙表増補改訂版データベース』への語種情報の付与 山崎 誠

15:10 - 15:40 並列を表す接続詞の文体分析 − 「まとめて検索 KOTONOHA」を用いて − 中俣 尚己

15:40 - 16:10 日本語学における計量的研究の傾向 荻野 綱男


石川聴講メモ
・分析対象の区切り方(品詞)
・観測された現象の帰属先の決め方(時代or個人)
・データ分類手法としてのPCAの使用のrational



2021/09/17

2021.9.16-17 Brno Linguistics Conferenceで研究発表

チェコのマサリク大学が主催するThe 9th Brno Conference on Linguistics Studies in Englishで研究発表を行いました。わたしはマサリク大学には過去数回訪問しており,今回はオンラインのため訪問がかなわなかったのが残念でした。



石川発表


今回はICNALEのインタビューデータを用いて,epistemic stance adverbについての調査結果を報告したのですが,その定義はむつかしく,結局,ly副詞全体を計量的にみるというアプローチで議論を進めました。

ly副詞の使用頻度に関してはかなりはっきりと習熟度効果が確認されました。


一方,L1差,タスク差,トピック差は必ずしも明白ではありませんでした。


2021/09/09

2021.9.9 神戸大附属小研究プロジェクト講話

神戸大附属小では教員の研究力を高めるために,研究プロジェクトを実施しておられます。石川がアドバイザーをつとめる2つの研究について,zoomで報告を受け,助言を行いました。


神戸大学附属小学校研究PJ:「コーパス言語学の分析技術を用いた小学校教科教育研究」

(1)「小学校国語科における対話力の養成にかかる基礎的研究」(代表:友永)
(2)「小学校英語科における語彙指導の充実にかかる基礎的研究」(代表:石田)


いつも熱心な附属の先生方に改めて敬意を表します!

 


2021/09/06

2021.9.6 兵庫県立尼崎稲園高等学校で講演

下記で1年生の方に探究活動の導入用の講演を行いました。コロナ対策ということで,1学年を2つにわけて実施する変則形式でした。


講師:石川慎一郎(神戸大)

演題:「探究入門:今なぜ探究なのか」




尼崎稲園高校は,JRの最寄り駅を降りてすぐ,というすばらしい立地にあります。「駅から登山」と言われる神戸大から見ると羨ましい限り。


 

2021/09/05

2021.9.4-5 東京言語研究所集中講義「言語統計」

下記で集中講義(オンライン)を担当しました。1日3コマ×2日のハードなスケジュールですが,仮説検定から始め,回帰分析,因子分析,主成分分析,クラスター分析,対応分析などについて概要をお話ししました。



研究所の講義としては最多の申し込みがあったということで,統計手法への関心の高まりを実感した2日間でした。


当初は昨年度の大学院講義のために作った教材をベースにやるつもりでしたが,見直してみると必ずしも十分わかりやすいものにはなっておらず,今回の講義担当を契機に全面的に教材を改訂しました。

授業では,昨年度の大学院講義同様,HAD(関西学院大学の清水先生作成の統計ソフト)を使ったのですが,HADは初心者にはかなりむつかしく,今回,1手法1ファイルとしてきりわけ,解説や分析手順をファイルに直接書き込んだHAD Annotated Editionというものを作成して,受講生の方にお試しで使っていただきました。この点については,手順が平易にわかって好評だったように感じました。

HAD Annotated Edition (石川,2021)~因子分析インタフェース~
※オレンジの部分が追記した内容で設定の意味や,分析までの手順を示している

受講されたのは熱心な方ばかりで,こちらの緊張も強く,終わるとぐったりと疲れてしばらく寝込みました・・・



2021/08/29

2021.8.29 中国湖南大学主催日本語学習者コーパスシンポジウムで講演

 下記で講演を行いました。湖南大学には,ずいぶん前に,講演で訪問したことがあります。懐かしい先生方と再会できて楽しいひと時でした。

 また,迫田久美子先生が構築されたI-JAS/C-JASという先駆的な2つの言語資料の尽きない価値を再発見する良い機会ともなりました。



2021/8/29
湖南大学シンポジウム「学習者コーパスと第二言語習得研究:量的研究と質的研究」(Online)


プログラム

開会あいさつ 【張佩霞】

第1部 日本語学習者コーパスの広がり

多言語母語の日本語学習者コーパスの現状 【迫田久美子】

中国語母語の日本語学習者コーパスの現状  【張佩霞】


第2部 I -JASを用いた日本語習得研究

I-JASから考える量的研究としてのコーパス分析が目指すもの 【李在鎬】

I-JASから考える第二言語習得の計量的概観 【石川慎一郎】

I-JASから考える見過ごされがちなテシマウとチャウの用法: 量と質との協働研究   【砂川有里子】


第3部 多様なコーパスを用いた日本語習得研究

縦断発話コーパスから考える学習者の動詞誤用の発達過程【迫田久美子】

横断作文コーパスから考える誤用研究の一パターン 【張佩霞】

縦断作文コーパスから考える形式名詞の習得:「もの」と「こと」を対比しながら    【蘇鷹】


第4部 総括ディスカッション

トピック:コーパス活用上の留意点

登壇者【石川慎一郎/李 在鎬/砂川有里子/張佩霞/蘇鷹】

司会者【迫田久美子】


閉会あいさつ【張佩霞】


石川発表


シンポジウム開会式(テンセントVoov上で実施)
※聴講者画像は映り込んでいないことを確認しています






2021/08/28

2021.8.28 学習者コーパス(I-JAS)研究会を聴講

下記に参加し,発表を聴講しました。

■ 日時:8月28日(土)14:00~16:00(日本時間)

■ 発表内容

1)蘇鷹(湖南大学)「中国人日本語学習者の形式名詞の習得ー「コト」を中心に」

2)堀恵子(筑波大学・東洋大学ほか)「日本語教育にデータ駆動型学習を取り入れる試み―機能語用例文データベース『はごろも』を利用してー」


いずれも大変興味深い発表でした。第1発表でとりあげられた「コト」は意味機能が多く,分析の際のコーディングが大変そうだなと思いました。


石川メモ:明鏡2版の意味分類
※明鏡2版では24区分。ちなみに明鏡初版の語義数は23で1つ増えた! 信頼できるコーディングがあれば因子分析などで語義を整理することができるかもしれない。

1) この世に起こる現象や出来事、人間の行為、また、それらの成果・推移などを広くいう。特に、大きな出来事や事件をいう。

2) 《連体修飾語を受けて》それによって特徴づけられるさまざまな事柄をいう。

3) 《「…の━」の形で》それに関連するさまざまな事柄を表す。

4) 《人代名詞や人を表す語+「の━」の形で》その人に関するさまざまな事柄を表す。また、その人そのものについてもいう。(★2版で追加?)

5) 《連体修飾語を受けて》ことばで表される内容を表す。意味や指示対象物をいう。

6) 《人代名詞に付いて》それについて言う意を表す。…に関して言うと。

7) 《雅号・通称などと本名との間にはさんで》同一人物であることを表す。すなわち。

8)《活用語の連体形を受けて》
ア 《思考・知覚・発話などの精神作用を表す動詞を伴って》精神作用の内容を表す。
イ 活用語を名詞化する

9) 命令的な伝達を表す。…ように。

10) 《「…━だ」の形で》
ア 特定の相手に対する勧告・忠告・要求などを表す。
イ 感動・詠嘆を表す。

11) 《「…という━だ」「…との━だ」の形で》伝聞を表す。…と聞く。…という。

12) 《「…━か」の形で》感動・詠嘆を表す。…ことだろう。

13) 《「…━だろう」の形で》推測を詠嘆的に表す。

14) 《「…━だし」の形で》理由や根拠を述べて(または、他にも理由や根拠があることをほのめかして)、下に続ける。

15) 《「…━この上ない」の形で》事柄の程度が最高である意を表す。

16)  《「━に(は)」の形で、感情を表す活用語の連体形や完了の助動詞「た」の付いた形を受けて》その感情を事実として強調する。

17)  《「…━と思う」「…━と存ずる」などの形で》それが相手や第三者についてなされた推測の内容であることを明示する。

18)  《「…の━」の形で、程度を表す副詞を受けて》その意味を強める。

19)  《「A━はAだが…」の形で》事実として肯定しながらも、十全に肯定できない要素があることをいう。一応Aであることは確かだが、しかし…。

20)  《形容詞の連体形を受けて》全体で副詞のように使って述語を修飾する。

21)  《「…って━よ」の形で》〔俗〕さとすような調子で、相手を説得したり言い含めたりする。

22) 《「…までの━だ」の形で》まで

23) 《「…だけの━はある」の形で》だけ
 
24) 《動詞の連用形・名詞・形容動詞の語幹などに付いて、「…ごと」と濁って》そのような事柄の意を表す。


2021/08/27

2021.8.24-27 関西大学大学院外国語教育学研究科で集中講義

表記でコーパス言語学の集中講義を行いました。博士後期課程の授業なので,開講にならない年も多く,久しぶりに関大に伺いました。

今回は,内容の半分を遠隔に,残り半分を対面で行う形式で実施しましたが,理論的なところはビデオで学び,実習的な部分を対面で指導するのは非常に効率的であったと感じました。このスタイルは,コロナ後も継続していきたいものです。

関大キャンパス前のモニュメント


2021/08/18

2011.8.18 AILA(国際応用言語学会)出席

オンラインで開催された表記大会で各種関連発表を聴講しました。また,下記の共同発表(筆頭発表者:奥切恵先生@聖心女子大)が行われました。

Megumi Okugiri  (University Of The Sacred Heart, Tokyo)/ Shin Ishikawa (Kobe University)/ Tom Gally (The University Of Tokyo)/ Lala Takeda (Showa Women’s University)

"The approach to introductions in English presentations by Japanese university students"



私はデータ解釈の事前ディスカッションに参加しただけですが,準備の過程で,奥切先生はじめ他の先生からいろいろ教えていただき,得難い体験でした。


・・・・・・・・・・・・・・・・・・・・・・・・・・・・・
コーパス関係発表の聴講メモ(文責:石川)

(1) Reframing individual differences as intra-individual variability: Reconceptualising emotion, motivation and willingness to communicate.
Peter Macintyre (Cape Breton University) 
※直接コーパス系の発表ではないが,個体と集団の関係についてのとらえ方は学習者コーパス研究に密接にかかわるもので,今回聴講した中で特に有益であった発表(石川)

1)個人差(individual difference:ID)には2つの意味
・人の体系的な違い(知能,態度,正確,同期づけ,感心)
・他人とどう違うか(inter-individual variation)/個人が時間的にどう変わっていくか(intra-individual variation)
・個人を集団に概括かできないのと同じく,集団を個人に概括化できない
・Hamaker (2012) タイプの速さと打ち間違い:集団で見れば反比例(速い人はミスも少ない),個人で見れば比例(無理に速く打つとミスが増える)
・データ合成の誤謬(Simpson's Paradox)
・答えがないとみるのではなく,答えは複数だととらえるべき
・Lowie & Verspoor (2019) differences between individuals cannot and need not be generalized beyond the individual learners we are observing
・McIntyre (2021) We must stop shamelessly discarding individual level data. Uniqueness is not a problem, it is an opportunity.

2)CDST 複雑系ダイナミックシステム理論(complex dynamic systems theory)
・システム内・システム間の相互作用に注目するメタ理論
・過程(process)を詳細に調べる研究手法
・複雑性と変化を強調する物の見方
・open 個人レベルではすべての影響を予測不可
・self-organizing システム間の相互作用に依拠。吸引子(attractor)と反発子(repeller)のゆるやかな結合
・emergent 部分ではなく,調和した意義のある全体を見る
・通常のRQ:WTCは不安に関係しているか/動機づけはL2能力を予測するか/不安は楽しみと相関するか
・CDST系のRQ:WTCは不変なのに不安度が高まっている場合何が起きているのか?/動機づけの瞬間瞬間の変化はどんな要因によるか?/不安度と楽しみ度が正比例するのはどんな場合か?
・CDSTの研究法 Lavelli, Pantoja, Hsu, Messinger, & Fogel, 2008
・変化する個人を研究対象に
・変化の前・途中・後で観察を実施
・過程の中で観察の密度をあげてゆく
・観察された行動を集約的に分析。量的・質的。発達と変化をもたらす過程そのものの具現化をゴールに設定する
・idiodynamic methodでの研究のやり方
・集団ではなく個人に焦点,communication eventsに焦点
・L2の各種コミュニケーションを記録
・その間の情意面の変化を評価するため,刺激想起インタビューstimulated recall(活動時のビデオを一緒にみながら学習者の注意や気づきに関するデータを集める)(Gass & Mackey 2000)を即時実施。関心対象(不安,動機)の変化を連続的に評価し,量的データとしてまとめる
・情意面の学習者自己評価を再検討
・すべてを書き起こして分析にかける
・WTC分析なら,そもそもあえてコミュニケーションするかしないか,言語習得で最も重要な決定
・WTC=機会をとらえ,コミュニケーションを先導(initiate)しようと選択する確率
・性格的(trait-like)傾向+瞬間瞬間で変わる状況(feeling willing)
・WTCと実際のL2使用の間にはcrossing the Rubicon
・The theoretical orientation of the pyramid model requires consideration of the here-and-now experience of WTC, even though much of the early WTC research approached it at the trait level( MacIntyre 2020, 127) ピラミッドモデルは性格レベルではなく個人の瞬間瞬間の実態でとらえるべき


(2) Gender representations of tennis players in the new media: A corpus-assisted critical discourse analytic study
Adrian Yip Queen Mary University Of London
・SNN研究ではmultimodality分析重要
・social semiotic approach
・内容分析+CDA
・ウィンブルドン2018,インスタ分析
・modality指標=彩度(color saturation)×輝度(illumination)
・女性描出のキーワードはmagical(色彩の詳細な区別と賛美系形容詞が女性の語彙選択 Lakoff 1973)
・男性選手はreal world matter,女性選手はmagical world


(3) The Dynamic Patterns of Syntactic Complexity in Chinese EFL Learners’ Writing Based on a Longitudinal Learner Corpus
Yurong Zheng  Harbin Engineering University
・CLEC (Chinese learner English Corpus)(Guis Shiqun & Yang Huizhong 2003)
・SSWECCL (Spoken and Written English Corpus of Chinese Learners) (Wen et all 2005/2008)
・Verspoor et al(2008) オランダの英語学習者 3年間に18の作文。語彙複雑性(語長)と統語複雑性の変化をトラック
・中国人英語学習者対象の同様の先行研究のポイント。non-linear, dynamic, inter-individual dif, fluctuating, staged development, progression and regression
・6学期間(=3年?)の学習者79人(学力は全国平均より3-5ポイント/100 高い程度)の作文を集めた自作コーパス(11万語)で語彙的多様性を分析
・3つの語彙多様性で0田をCompleat Lexical Tutorで計算
 ・LD lexical density 内容語/総語数
 ・LV lexical variation 異なり語数の2乗/総語数
 ・LS lexical sophistication 上位2000語占有率,AWL率,off-list語率
・LDは微増,LVははっきり増加,top2000語率は減少,AWL率は上昇,off-list率も減少
・LD/LV相関は0.26-0.34
・2000語率はLDと-0,3,LVと-0.2から-0.5程度


(4) Interpreting patterns in corpora of L2 speech: The challenges of finding a meaningful L1 reference point
Dana Gablasova & Vaclav Brezina Lancaster University
・SLA/LCRの目的は,L2使用における体系的変異+L2習得過程および成果に体系的に影響する要因解明
・CIAではL1コーパスと比較することが多い
・CIAのためには2つのコーパスはcomparable(比較対象以外は統制)であるべきだが,コーパスの代表性問題は微妙
・発話コーパスに影響を及ぼす要因:モード,ジャンル,タスクタイプ,タスク属性(指示・時間・インタビュワートレーニング,インタビュワー数など)
・CACCODE(1138人,500万語),BNC Demo(1407人,430万),BNC2014 Spoken(376人,480万語),BNC64(64人,160万),LOCNEC(50人,12万)
・I think:BNCSP/LOCNEC>>>BNC Demo
・受け身 CANC>>>BNC Demo
・過去形 LOCNEC>>>BNC SP
・同じL1でも内容が変われば言語も変わる(結果の解釈は慎重に)
・Trinity Lancaster Corpus (L2対話,2053人,430万語)L1はスペイン,イタリア,ヒンディ中心。Presentatoin, Discussion, Interview, Conversation
・タスクタイプはstance takingに影響
・stance marking = a perspective toward (a) what is being communicated and (b) the interlocutors (Reilley et al 2005)
・関連副詞INT>PRES, 形容詞INT>PRES,動詞CONV>PRES


(5) Spoken learner corpora : diversity and comparability.
John Osborne/ Evgenia Nicol-Bakaldina   University Savoie Mont Blanc
・社会的対話では意味の伝達手段は無数にあるので記録すべき文脈情報は無限で分析作業はblack holeとなる(Adlphs & Knight 2010:44)
・複雑性は上昇:独話コーパス(PAROLE corpus)<縦断コーパス(独話・発話)<教室対話(とくに初級)<CLIL授業
・PAROLEの分析から。個人差はあるが,WPMについてはNNSの最頻値は100-120,NSは90-110/ 120-180。
・CEFRとの関連付け A1(30-50), A2 (60), B1(70-80), B2(90-110), C1(120-180), ENS (130-220)
・縦断コーパスSCFLE(フランス語学習者12人)分析→個人差が大きい(A型:不変,B型:下がって持ち直す,C:上がって下がる,D:上下繰り返す)。集約してしまうとよくわからなくなるが,集団としての傾向もいくらか抽出可
・教室コーパス(パリの英語学習小学生6-8歳,40分授業3週分,1年に3回撮影,教師,学習者集団,学習者個人にわけて書き起こし)
・教師は1年生向けにはmodellingや引き出し質問,命令,positiveな応答確認中心だが,2年生向けになると引き出しや,単純反復が増える
・児童は1年生だと授業内の練習時間だけでターゲット語(pear, orange, chocolate)を集中使用(反復練習など),2年生になると使用機会が授業内でまんべんなく広がる
・CLIL(フランス高校,英語で学ぶ歴史クラス)16時間の授業ビデオ,教師2人,11万語
・ExMARaLDAでアノテーションしてエクセルで解析
・インプットとアウトプットの組み合わせは複層的:教師発話によるインプット→学習者Aがアウトプットする=ほかの学習者のインプットになる・・・
・10か月間のエラー量は単元内でみると上がって下がり,全体で見てもやはり上がって下がる


(6) The Effects of Explicit and Implicit Instruction on the Use of Discourse Markers in Japanese EFL Learners’ Speech
Kazunari Shimada MEXT Senior Specialist For Textbooks
・DM指導と学習者のDM使用の関係をさぐる
・大学生58人,オンライン授業,英語力はTOEIC365-500
・まず学生はQAタスク(海外どこ行きたい?)と発話タスク(友達は大事か?)で自分の発話を録音して提出(pre)
・その後教師が講義ビデオでDMを直接指導(模範解答内のDMを強調表示)+教師は個別学生にメールでフィードバック
・学生ははロールプレイタスクを実施
・教師は個別学生にメールフィードバック
・学生は絵描写タスクを実施
・教師は個別学生にメールフィードバック
・学生はQAタスクと発話タスクで自分の発話を録音して提出(post)
・教師が講義ビデオでDMを直接指導+教師は個別学生にメールでフィードバック
・pre/postと似た発話テスト(delayed)
・pre/post/delayの3段階変化(QAの場合)
・and 17--8--32
・anyway/finally 0--0--0
・because 14--11--16
・for example 0-9-0
・and because soのような簡単なものはもともと多用
・指導でfor example, how about, wellなどの使用は増える
・時間がたつとDMの多様性はへる


(7) Lexical complexity and spoken L2 English proficiency in the Trinity Lancaster Corpus
Raffaella Bottini Lancaster University
・Lexical density(内容語vs機能語)
・Lexical sophistication (上級語比率)logCW (content word)/ log FW(function word) BNC2014と比較
・Lexical diversity(異なり語分布)MTLD(TTR改良版)
・発表者はLex Complexity Tool(Bottini 投稿中)を新規に開発 各種の複雑性指標に加え,BNC2014語彙表との対照結果を表示できる
・3指標に対するL2習熟度の影響(主効果)FW(0.02) CW(0,03), MTLD (0.1)
・3指標に対するL1タイプの影響(主効果)CD(0.04) MTLD (0.02) FW(0.01)
・ともに影響は弱い
・総じていえば,習熟度があがるとMTLDとCWはあがり,FWは下がる傾向
・MTLD イタリア<スペイン<中国
・FW 中国<イタ<スペ
・CW イタ<中国<スペ
・L1が英語に近い言語(スペイン語)であるほど高頻度語を多用し,多様性の低いテキストを産出


(8) Measuring speaking fluency automatically for the purpose of research and assessment
Nivja De Jong Leiden University
・応用言語学:cognitive(思想を負荷なく言葉へ)/utterance(速く話す)/perceived fluency(相手からどう聞こえるか) (Segalowitz 2010)
・ACTFL, IELTS, TOEFLなど:pauseやslow paceといったdisfluencyの少なさを評価
・Bosker et al (2013/14)
・人手による主観評価の84%は客観指標で説明可能
・話速を人工的に変えても評価は一定
・PRAAT-script(2019) salient pauseを自動検出,発話速度も。filled pause/ repetition/ repairの自動検出には対応していない
・PRAAT script 2020を開発。従前不可だった要素にも対応
・intensity(dB)の山と底,voiced peaksで1語(シラブル)を自動検出。人手コーディングとの相関は話速で.86,articulation rateで.92


(9) Linguistic strategies for expressing stance in advanced L2 students’ critique writing: a corpus based study
Abdulwahid Al Zumor KING KHALID UNIVERSITY
・stance= personal views/ attitude/ position 
・73人のサウジの大学院生の批評エッセイ(サウジにおける学習障壁),7.8万語
・Lancsbox使用
・事前に知識と使用経験を調査,booster,hedge, attitude markerはある程度既知だが,self-mentionはあまり意識的には知らない
・booster: very > clear>without>a lot...
・hedge:  general> should > claim> assume > would...
・attitude :important>agree>only>fail>good...
・self-mention:  I>we>my>our...
・明示的指導・トレーニングが大事


(10) Dynamic data-driven learning
Ana Frankenberg-Garcia University Of Surrey
・発見学習(discovery learning)=構成主義的教授法
・Piaget (1936) 主体的・蓄積的に新しいことを学んでいく
・Vygotsky(1978)圧倒的なタスクを与えず少しずつ足場かけ
・Johns (1991) DDLはawareness raisingに有用
・DDLの2つの方法(Gabrielatos 2005; Boulton 2010)
・the hard, hands-on way(コンコーダンサでデータを直接検索)
・the soft, hands-off way (あらかじめ教師が選んだコンコーダンスラインや単語リストを分析)
・Frankenberg-Garcia (2012, 2016):両方のアプローチは相補的
・第3の方法(dynamic approach to DDL-D-DDL)を提案:ミニデータ(just-in-timeを検索体験させる(hands-on)が,複雑なソフトで大量の言語データを扱わせることはしない(hands-off)
・2つのシステムを利用
・ColloCaid (www.collocaid.uk)(Frankenberg-Garcia et al. 2019) 英文を入力すると主要語にポップアップが出てよくあるコロケーションを示す。必要な場合は画面上で修正可能
・コベントリ大学が運営するBAWE QuicklinksEnglish(British Academic Spoken English Corpus, 英国の優良学生エッセイ,650万語,Sketch Engineで公開):入力語に対してBAWEからの用例を表示する。教師が校閲に使ったデータセットをencyclopediaとして共有(例:学生がsupport that SVと書いたがコーパスではsupportの目的語は名詞であった,など)
石川補足
collocaid(上記では入力した英文中のusingに対して,
widely use,use for など高頻度のコロケーションが提案されている。
※入力した英文の文脈に応じたuseのコロケーションではなく,
単にuseの取りうるコロケーションをリストする)

bawe quick link(作文中のよくある誤用例についてコーパス用例を示す)



(11) Corpus-driven Approach of English Vocabulary Learning at Chinese Tertiary Level Program
Dr. Yurong Zheng (Harbin Engineering University) 
・大学で「English Lexicology」という授業を担当(単語の基礎概念,語彙発達,形態的構造,語形成,語の意味,イディオム,辞書など)
・ RIPEモデル: resource-providing, information-inputting, paradigm-setting and evaluation-enhancing(資料配布,情報提示,データ分析枠組み指導,評価改善)
・資料配布ではCOCA, COHA, CLEC (100万語の中国人学習者コーパス),自作の縦断学習者コーパス,オンラインの新語辞典(wordspy.com)や語彙サイト(lextutor)を併用
・情報付与では,語形成や単語の意味変化を解説
・分析枠組みとして「on-line/onlineの意味の差」や「nessとityの生産性」などのテーマを与え,頻度・コンコーダンスなどを指導して練習させる
・評価として,形成的評価を採用(評定の6割):討論,発表,レポート
・質問紙とインタビューで受講学生の評価を調査:好反応


(12) Learning L2 Non-Congruent Collocations: The Effect of a Corpus-assisted Contrastive Analysis and Translation Approach
Dr. Rezan Alharbi (King Saud University) 
・Non-congruent collocations (L1にないコロケーション):習得・使用・理解ともに困難
・NCコロケーションの習得を促進する環境の解明は不十分
・言語対照(L1/L2翻訳)が有用? コーパス活用が有用?
・DDL(実物性・没入性・学習者自主性)
・CAT(L1/L2 contrastive analysis+translation)(認知面,語彙転移,バイリンガルメンタルレキシコン表象,語彙習得の心理学的モデル,翻訳)
・両方を組み合わせて実験実施
・サウジ学習者129人が,30種のNC型コロケーション(形容詞+名詞)を習得
・3条件(コーパスなし言語対照あり/コーパスあり言語対照あり/コーパスあり言語対照なし/統制)
・プレテスト(能動的想起,受動的想起)
・6セッションでターゲットの学習
・直後ポストテスト,3週間の遅延ポスト
・コーパスあり言語対照あり学習群が最高値


(13) Direct and Indirect Data-Driven Learning: Affordances and Constraints
Xiaoya Sun (Nanyang Technological University) 
・DDL隆盛(Gilguin & Granger, 2010)
・直接アプローチと間接アプローチ(Boulton 2017)
・にもかかわらず教師はDDLと言えば直接DDLだけと思い込み,それを手間と感じるため教授法の主流になっていない
・中国人学習者のヘッジ習得について,直接DDLと間接DDLの効果を比較
・共通事前学習
(a) MICUSPからヘッジあり文と人工的にヘッジを抜いた文を組み合わせてハンドアウトとして配布,学習者ペアに2文を比較させる(容認性判断,容認性を高める言語的工夫を探す,それらの形式的特徴を書き出す)
(b) ヘッジの機能別リストを配布
・直接DDL組(MICUSPで知らないヘッジを探し,コンコーダンス機能で意味と用法を推測させる,任意の3つのヘッジを選び,ICNALEの中国人作文とNS作文で比較させる,ICNALEの中国人・NS作文を1つずつ選び使われているヘッジを調べる,MICUSPの上級作文からヘッジをうまく使っている段落を探させる)
・間接DDL組(知らないヘッジの意味探しを辞書を引いて行う,その後,ヘッジを抜いたMICUSP用例のプリントをもらい空欄を埋める,原文のヘッジと比較,自分の過去作文のヘッジを修正)
・直接群のヘッジ使用量はpre/post/dpで27--36--31,間接群は32--48--39
・間接群のほうが効果高い
・学習者アンケートでは直接群はコーパスが役立つと述べたがコーパスが辞書より有益だという点については懐疑的,間接群は指導が役立ったと述懐


(14) Corpora in interaction: A conversational study of Data-Driven Learning interactions with the FLEURON database
Dr. Biagio Ursi (Aix-Marseille University) 
・DDLは英語以外にも効果
・学習者はFLEURONデータベース(石川注:French as a Foreign Language at University: Digital Resources and Tools)(https://fleuron.atilf.fr/内のAudio Visualコーパスをコンコーダンサで分析
・仏語学習者と教師のやりとりをマルチモーダル(視線,ジェスチャー,姿勢)データとして分析(会話分析的)

FleuronHPより使用可能なフランス語ビデオ資料の例




2021/08/16

2021.8.16 東京外大博士論文審査会

下記の審査会に遠隔で出席しました。


 ローレンス・ニューベリーペイトン氏博士論文公開審査
『英語句動詞と日本語複合動詞の比較研究-第二言語習得・言語教育の視点から-』


日時:2021年8月16日(月) 13:00-17:15
会場:東京外国語大学留学生日本語教育センター1階さくらホール/zoom

審査委員
佐野洋教授(主査),望月圭子 (主任指導教員),川村大教授,投野由紀夫教授,石川慎一郎教授(神戸大学)


審査会風景(画像匿名加工済み)


2021/08/11

2021.8.11 大阪大学マルチリンガル教育センター「英語教育オンラインセミナー」講演会

表記で「コーパスを用いた英語教育の新しい展開:指導から評価まで」という題目で講演を行いました。



当日は中高の先生方を含めて約50名の参加者があり,コーパスの可能性についてお話させていただきました。


こうした総括的な内容の講演は,自分のやってきた仕事をまとめる良い機会になります。お話をまとめる準備作業の中で,別個のデータや調査間の思わぬつながりやmissing linkへの気づきがありました。



2021/08/10

2021.8.10-11 日本語教育システム支援研究会CASTEL-Jに参加

表記に参加し,発表を聴講しました。


完全オンラインでの開催でしたが,シンポ・発表・ポスターと内容も盛りだくさんで,運営もスムーズで勉強になりました。padletをプラットフォームにしたポスター発表では,多くの質疑コメントがついており,オンライン学会運営のお手本としても勉強になる点が多数ありました。


主なコーパス関係の発表メモ(文責:石川)

★ライティングの評価再考:機械と人間の役割と今後の教育支援
伊集院郁子(東京外国語大学)、小森和子(明治大学)、安高紀子(明治大学)、髙野愛子(大東文化大学)、李在鎬(早稲田大学)
・作文レベル自動判定システムj-writerの学習データにI-JASを使用(Lee&Hasebe 2020)。

★I-JAS コーパス「対話」タスクにおける接続表現の使用について-中国語・韓国語・英語母語話者と日本語母語話者を比較して-
長田涼子(テンプル大学ジャパンキャンパス)
・接続表現を学習者は過少使用するが,「そして」 「その後」 「それから」は多用

★自律型日本語学習のための単語分散表現モデルの構築
豊田哲也(東邦大学)
・日本語類語選択問題の自動生成を目指す
・分散表現(word2vec)でコーパスからベクトルを取り出す
・一般には大型コーパス利用が望ましいが,教育的目的では小さいデータを使う利点も
・wikiコーパスのデータをカテゴリ別で絞り込んだ結果,元データを5割程度削減したときに正解選択肢類似度(平均値)が最も高くなる


2021/08/08

2021.8.7-8 全国英語教育学会長野大会に参加・研究発表

表記に参加し,発表を行いました。

発表題目「学習者コーパスと産出評価:ICNALE GRAプロジェクトの狙い」



中級学習者に固定した場合,日本人作文の評価は相対的に高い。
高評価は文法面の強さが支える。弱みは読み手との関与性の構築と維持か?

開会式のお話では参加申し込み者が600名。zoomで見ていると,講演などでは,400名程度の参加がありました。これだけの人数にも関わらず運営はスムーズで,学会運営面でもいろいろと学ぶ機会が多かったです。

・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・
コーパス関係の発表のメモ(文責:石川)

★新学習指導要領下における中学生のための語彙リストの開発
佐藤 剛氏(弘前大学)
・中学教科書をコーパス化して語彙を抽出
・頻度とレンジをかけたARF(average reduced frequency)指数で調整
===================================================
Brezina (2018 p.55)よりARFについての石川メモ
・提唱者はSavicky & Hlavacova 2002
・分布度と頻度を自動で評価
・レンジに比べ,サブコーパスに分かれていなくても計算可能という利点
・v値=コーパス総語数÷ターゲット語頻度
・ARF={(ラストと1語目間距離とvの小さいほう)+(1語目と2語目間距離とvの小さいほう)+・・・(n語目・n+1語目間距離とvの小さいほう)}÷v

(計算実例)
 ・100万語コーパスで頻度5の単語AとB

・Aは近傍にかたまって出現しており,出現位置は第1(冒頭から1語目),第2(5語目),第3(10語目),第4(15語目),第5(20語目)
・単語Aのvは100万÷5=20万
・ARFの各項目値の計算
(a) ラスト出現位置(100万語中の20語目)から第1出現位置(1語目)までの距離=999,981 vs 20万のちいさいほう ★このときだけプラス1になる
(b) 第1から第2までの距離=4 vs 20万の小さいほう
(c)  第2から第3までの距離=5 vs 20万の小さいほう
(d) 第3から第4までの距離=5 vs 20万の小さいほう
(e) 第4から第5までの距離=5 vs 20万の小さいほう
・単語AのARF=(20万+4+5+5+5)÷20万=1.000095

・Bはコーパス全体にまんべんなく出現しており,出現位置は第1(1語目),第2(20万語目),第3(40万語目),第4(60万語目),第5(80万語目)
(a) ラスト出現位置(100万語中の80語目)から1語目出現位置(1語目)までの距離=200,001 vs 20万のちいさいほう
(b) 第1から第2までの距離=199,999  vs 20万の小さいほう
(c) 第2から第3までの距離=20万 vs 20万の小さいほう
(d) 第3から第4までの距離=20万 vs 20万の小さいほう
(e) 第4から第5までの距離=20万 vs 20万の小さいほう
・単語BのARF=(20万+199,999+20万+20万+20万)÷20万=4.99995

※Lancaster Stats Tools Onlineで自動計算可(使ってみたが,位置は自分で調べる必要あり。数値は整数値まで)
上の例Aを計算させたところ

上の例Bを計算させたところ

===================================================

★日本人英語学習者の英作文における後置修飾を含む名詞句構造の産出―学習者コーパスを用いた研究―
田中 広宣氏(東京大学大学院生)
・NICER1.3.2のEducationテーマの作文53本(1.6万語)をタグ付け
・to不定詞・分詞・関係代名詞が含まれるものを抽出し目視で後置修飾を探す
・A2,B1,B2にかけて,正確な産出を行った学生比率
 不定詞は23から72%へ,分詞は8%から17%へ,関係節whoは46%から72%へ,関係節whichは46%から39%へ,関係節thatは8%から11%へ
・総使用量,正確使用量ともに増加

★英語の定冠詞選択における「一般・特定」の役割分析
高橋 俊章氏(山口大学)
・NICE/NICERで質的用例検証

★発信語彙の定着を促すICT 教材―EasyConc for FlashCard.fmp12 とBingoSheet for FlashCard.xlsm の開発と活用―
日臺 滋之氏(玉川大学)
・パフォーマンス課題実施後に英語で言いたかったが言えなかった語を書いてもらう
・EasyConc(日本語表現と英語表現が対応する日英パラレル・コーパス)
・EasyConc for FlashCard.fmp12(iOS 仕様)
・BingoSheet for FlashCard.xlsm(Windows 仕様)
・言えなかった語は「行く」「好き」など基本語だがほかの語と結合してむつかしくなる

★英検難易度に基づく多義前置詞in, on, at の語義分布と出現頻度
南部 匡彦氏(国際短期大学)
・英検コーパスを自主構築
・in/on/atの語彙区分をコーディング
・in/atは似るがonは独自(抽象・句動詞多い)

★小学校英語における読むこと・書くことへの接続―検定教科書に基づく頻度分析を通して―
星野 由子氏(千葉大学)・清水 遥氏(東北学院大学)
・小学校英語教科書コーパス+リスニングスクリプトコーパスを構築
・見る頻度,聞く頻度を計量




2021/08/04

2021.8.4 Q2最終試験・評定決定

水曜クラスの試験が終了し,16週間の前期が終わりました。下記,担当する一般教養の4クラスの成績分布です。(A)Sは上位10%以内,(B)S+Aは上位40%以内というルールに抵触しないよう最終評定が決定されています。これで一山超えました。

成績分布概況(%)



2021/08/03

2021.8.3 学内科研費説明会メモ

 配布資料により,(自分関係の)ポイントを整理。

1)B/Cの場合,8/2開始,10/6締め切り(望ましい1稿完成は9月上旬ごろか?)
2)「研究目的方法(5p)」と「着想経緯(1p)」は合体
3)「挑戦」の審査観点:挑戦性・妥当性・適切性の3観点総合から,「挑戦性」「妥当・適切性」の2観点へ。(挑戦性のウェイトがあがる)
4)萌芽の審査は,1段階・2段階で同じ審査員がやることに
5)H29/3/24文科省告知「大学などにおける過度のローカルルールの改善」事務連絡


2021/07/30

2021.7.30 外国語教育コンテンツ論コース第3回集団指導でゼミ生が発表

 外国語教育コンテンツ論コース第3回集団指導

2021年7月30日(金)1040~ Zoom


D3 鄧 琪

現代日本語における漢語の諸相ー語用論的特性:産出モード・産出環境の影響ー 



D3 肖 锦 莲

中国語を母語とする日本語学習者の文末詞使用



M2 安 美 彦

中国の日本語教科書における条件節の扱いに関する考察-「総合日本語」を例として- 



M2 堀 家 利 沙

高校英語指導における句動詞の扱い―教科書とセンター試験の分析から― 



M2 佐々木 恭子

ICNALEにみる日本人学習者の理由表現使用



2021/07/20

2021.7.20 兵庫県立長田高校人文数理探究類型最終発表会

表記に出席し,講話を行いました。



8つの提言というのは生徒さんの発表を聞いていて感じたことです。

1 言うべきことは全部言う   Say all of what you should say
★実験の前提,実験のやり方,質問紙調査なら具体的な質問文などを省略せず詳しく報告する。発表だけでやったことの全体像がきちんと伝わるようにする。

2 問題をクリアに示す   Clarify the problem
★解決すべき問題・課題を明確に示し,その解決への道筋を明確に示す。

3 客観的に議論できる問いを   Have good RQs
★客観的なデータに基づいて反論が可能な(Karl Popper)問いをたて,それを議論する。

4 AimとRQを前面に   More focus on Aim & RQ
★実験が先ではなく,Aim/RQを先に立て,その手段として実験を位置づける

5 「狭く深い」実験を   Depth rather than width
★たくさんのことを浅く調べるのではなく,絞り込まれた1つの観点を徹底的に詳しく調べる。

6 調査対象の選定根拠を  Show reasons for your choice
★なぜそれに注目したのか,なぜそれを観点としたのか,その根拠を示す。

7 分割して議論する  Analyze only one parameter at one time
★対象を塊で議論せず,構成要素に分解してからリサーチデザインを組む。

8 指標を疑う   Doubt on your indices
★使用している指標が真に測りたいものを測っているのか,内省的・批判的に考える。(たとえば,blinks---瞬目/まばたき数は,指標として何を計っているのか究極的には不明)

こうやって書き出してみると,毎週やっている大学院のゼミ指導(修士・博士)とまったく同じ内容であることに気づきます。高校生探究であれ,博士論文であれ,研究には一定の普遍的な道筋や作法があるのだと言えるでしょう。