このブログを検索

2021/11/19

2021.11.19 ランカスター大学Introducing the Written British National Corpus BNC2014シンポジウム参加(オンライン)

表記イベントに参加しました。2年前に訪問したランカスター大学やランカスターの古城の風景が随所に出てきて,懐かしいひと時でもありました。新しい実証的な英語研究を強力に駆動するすばらしい言語資源がリリースされたことを,同じ分野の一人として本当にうれしく思います。

Brezina氏講演

McEnery氏講演

Programme

12.00-12.30 Online programme: Lancaster Corpus Linguistics

12.30 – 12.45 Vaclav Brezina (Lancaster University): Welcome and Introduction to the event

12.45 – 12.50 Elena Semino (Lancaster University): Welcome from the Director of The ESRC Centre for Corpus Approaches to Social Science (CASS)

12.50 – 12.55 Paul Connolly (Lancaster University): Welcome from the Dean of Faculty of Arts and Social Sciences (FASS)

12.55-13.00 Break

13.00 – 13.15 Tony McEnery (Lancaster University): The idea of the written BNC2014

13.15 – 13.30 Dawn Knight (Cardiff University): Building a National Corpus:  The story of the National Corpus of Contemporary Welsh

13.30 – 13.45 Vaclav Brezina (Lancaster University): Current British English

13.45 – 14.00 Vaclav Brezina and William Platt (Lancaster University): Exploring the BNC2014 using #LancsBox X

14.00 – 14.15 Randi Reppen (Northern Arizona University): Corpora in the classroom

14.15 – 14.30 Alice Deignan (University of Leeds): Corpora in education

14.30-14.45 Dana Gablasova (Lancaster University): Corpus for schools

14.45 – 15.00 Bas Aarts (University College London): Plonker of a politician NPs

15.00 – 15.15 Break

15.15-15.30 Marc Alexander (University of Glasgow): British English: A historical perspective

15.30 -15.45 Michaela Mahlberg (University of Birmingham): Corpora and fiction

15.45 – 16.00 Martin Wynne (University of Oxford): CLARIN – corpora, corpus tools and collaboration


 ※BNC2014関係のVaclav Brezina & Tony McEnery先生講演メモ(文責:石川)

・88171ファイル,8ジャンル(52サブジャンル),構築に7年間
・地域的,社会的,現使用域の変種を網羅,バランスを改善,言語変化と社会変化を反映,版権処理,1994版に従いつつも間違いは修正
・BNCをupdate,originalを改良,現在のイギリス英語を記録,サンプリングの問題を改善,統計を洗練(LancsBox),無償公開,新しい電子コミュニケーションへの配慮
・ジャンル比率の変更
  学術 16.5%→20%
  小説16.6%→20%
  新聞9.6%→20%
  雑誌7.6%→15%
  E言語0.2%→5%
  そのほか39.5%→10%
  話し言葉10%→10%
・データは2010~2020年。そのうち2014-16で72%とターゲット年への集約が高い。
・旧版は1960-1984で630万語,1985-1993で7900万語など,幅が広く,一般の理解とは別に,「1994年の英語」や「1990年代初頭の英語」の代表になっていなかった

・1994/2014の3つの変化: informal化,e言語増大,法助動詞の減少
・(1)  informal化:don't などの縮約は学術分野でも+28%
・(2) e言語増大:Alexa, (software→)App, Blog, Congratsなど,ウェブ関連語やウェブ特有の使い方
・(3) 法助動詞減少:must ▲42%(減少率はFLOB/ BE06とほぼ同じ) may ▲40%  shall ▲60%
・統計分析によるジャンル特性の再検証(※はっきり述べていなかったがおそらくMD法)
・involved(縮約,代名詞,私秘動詞,強調emphatic) vs informational(長い語,名詞) 
Informal Speech---TV--EL(SMS)---EL(Forum)---EL(Email)--Fiction---EL(Review)---EL(social)---EL(blog)---Hansard---Magazines---Academic Hum --- News Mass --- Academic PLE --- News Serious ---- Academic Soc --- News Regional --- Academic Tec --- Academic Natural ----Academic Medial --- Business Reports

★要約すると,Involved---くだけた発話---各種ネット言語--ブログ---雑誌---学術&新聞---Informationalという階層性。
・ネット言語はくだけた発話に近い。ブログはネット言語でありながら,雑誌などと同じフォーマリティを持つ。新聞はAcademicと近いかたさを持つ。

※感想
「現代イギリス英語」の精華であるBNCの2014のリリース発表をチェコ出身のBrezina氏が語る・・・ 研究のグローバル化と国境を超えるコーパス研究の可能性を強く感じるシンポだった。ひるがえって日本の日本語研究に同様の将来は来るだろうか?