このブログを検索

2021/11/30

2021.11.30 国立国語研究所セミナー参加(オンライン)

下記を聴講しました。

第231回NINJALサロン
2021年11月30日

浅原 正幸 (コーパス開発センター 教授)

「「過去」「未来」を主題にした作文の分析 ―教育基本語彙 増補改訂版との対照分析―」 


メモ

言語における時間をテーマにした大型科研の研究成果の一部。英語の学習者コーパス研究にも応用できる興味深い内容。ただ,過去をテーマにした作文,未来をテーマにした作文,というのは,意外に定義がむつかしそう。「2050年,未来の自動車はすべて電気になっているだろう。そもそも翻ってみると,自動車の誕生は18世紀のフランスとされ,爾来・・・」のような感じだと,書き出しは未来だけれど,作文の大半は過去について書いている,ということもあるかもしれない。テーマ(トピック)の統制の難しさはすべてのコーパス研究に共通する。

2021/11/25

2021.11.25 兵庫県立津名高等学校インスパイア―事業特別講演

この数年,毎年2回ずつ伺っている津名高校での講演です。地域活性化をテーマにした生徒さんの発表を聴講し,コメントと講話を行いました。堂々とした発表で,今後の生徒さんのさらなる成長が楽しみです。

会場


往路は,JRから高速バスに乗り換える舞子で少し時間があったので,淡路海峡大橋を上から見られる「舞子海上プロムナード」を少し覗いてきました。

橋の下は海。わかっていても結構怖い。

淡路からの帰路はちょうど夕方の時刻になり,いつもながらの舞子の美しい夕焼けが見られます。年2回,この光景を見るのが本当に楽しみです。はるばる海外まで行かなくとも,絶景はすぐそばにあるな,と実感。

舞子から淡路方面を望む。




2021/11/23

2021.11.23 英語コーパス学会役員会参加

表記に参加。主な議題は,2022年の大会開催形態について。現状は感染者数も落ち着いており,この状況なら2022年10月の対面開催は大丈夫そうな気もしますが,コロナ禍になって学んだのは先がまったく読めないということ。学会の場合,直前の開催形態の変更はリスクを伴う判断となり,どちらでいくか悩ましいところです。どこの学会も同じ悩みを抱えているところかと思いますが。。。

 

2021/11/19

2021.11.19 ランカスター大学Introducing the Written British National Corpus BNC2014シンポジウム参加(オンライン)

表記イベントに参加しました。2年前に訪問したランカスター大学やランカスターの古城の風景が随所に出てきて,懐かしいひと時でもありました。新しい実証的な英語研究を強力に駆動するすばらしい言語資源がリリースされたことを,同じ分野の一人として本当にうれしく思います。

Brezina氏講演

McEnery氏講演

Programme

12.00-12.30 Online programme: Lancaster Corpus Linguistics

12.30 – 12.45 Vaclav Brezina (Lancaster University): Welcome and Introduction to the event

12.45 – 12.50 Elena Semino (Lancaster University): Welcome from the Director of The ESRC Centre for Corpus Approaches to Social Science (CASS)

12.50 – 12.55 Paul Connolly (Lancaster University): Welcome from the Dean of Faculty of Arts and Social Sciences (FASS)

12.55-13.00 Break

13.00 – 13.15 Tony McEnery (Lancaster University): The idea of the written BNC2014

13.15 – 13.30 Dawn Knight (Cardiff University): Building a National Corpus:  The story of the National Corpus of Contemporary Welsh

13.30 – 13.45 Vaclav Brezina (Lancaster University): Current British English

13.45 – 14.00 Vaclav Brezina and William Platt (Lancaster University): Exploring the BNC2014 using #LancsBox X

14.00 – 14.15 Randi Reppen (Northern Arizona University): Corpora in the classroom

14.15 – 14.30 Alice Deignan (University of Leeds): Corpora in education

14.30-14.45 Dana Gablasova (Lancaster University): Corpus for schools

14.45 – 15.00 Bas Aarts (University College London): Plonker of a politician NPs

15.00 – 15.15 Break

15.15-15.30 Marc Alexander (University of Glasgow): British English: A historical perspective

15.30 -15.45 Michaela Mahlberg (University of Birmingham): Corpora and fiction

15.45 – 16.00 Martin Wynne (University of Oxford): CLARIN – corpora, corpus tools and collaboration


 ※BNC2014関係のVaclav Brezina & Tony McEnery先生講演メモ(文責:石川)

・88171ファイル,8ジャンル(52サブジャンル),構築に7年間
・地域的,社会的,現使用域の変種を網羅,バランスを改善,言語変化と社会変化を反映,版権処理,1994版に従いつつも間違いは修正
・BNCをupdate,originalを改良,現在のイギリス英語を記録,サンプリングの問題を改善,統計を洗練(LancsBox),無償公開,新しい電子コミュニケーションへの配慮
・ジャンル比率の変更
  学術 16.5%→20%
  小説16.6%→20%
  新聞9.6%→20%
  雑誌7.6%→15%
  E言語0.2%→5%
  そのほか39.5%→10%
  話し言葉10%→10%
・データは2010~2020年。そのうち2014-16で72%とターゲット年への集約が高い。
・旧版は1960-1984で630万語,1985-1993で7900万語など,幅が広く,一般の理解とは別に,「1994年の英語」や「1990年代初頭の英語」の代表になっていなかった

・1994/2014の3つの変化: informal化,e言語増大,法助動詞の減少
・(1)  informal化:don't などの縮約は学術分野でも+28%
・(2) e言語増大:Alexa, (software→)App, Blog, Congratsなど,ウェブ関連語やウェブ特有の使い方
・(3) 法助動詞減少:must ▲42%(減少率はFLOB/ BE06とほぼ同じ) may ▲40%  shall ▲60%
・統計分析によるジャンル特性の再検証(※はっきり述べていなかったがおそらくMD法)
・involved(縮約,代名詞,私秘動詞,強調emphatic) vs informational(長い語,名詞) 
Informal Speech---TV--EL(SMS)---EL(Forum)---EL(Email)--Fiction---EL(Review)---EL(social)---EL(blog)---Hansard---Magazines---Academic Hum --- News Mass --- Academic PLE --- News Serious ---- Academic Soc --- News Regional --- Academic Tec --- Academic Natural ----Academic Medial --- Business Reports

★要約すると,Involved---くだけた発話---各種ネット言語--ブログ---雑誌---学術&新聞---Informationalという階層性。
・ネット言語はくだけた発話に近い。ブログはネット言語でありながら,雑誌などと同じフォーマリティを持つ。新聞はAcademicと近いかたさを持つ。

※感想
「現代イギリス英語」の精華であるBNCの2014のリリース発表をチェコ出身のBrezina氏が語る・・・ 研究のグローバル化と国境を超えるコーパス研究の可能性を強く感じるシンポだった。ひるがえって日本の日本語研究に同様の将来は来るだろうか?




2021/11/04

2021.11.04 電気通信大「イノベーティブ理工系英語教育研究ステーション第24回研究会」で講演

イノベーティブ理工系英語教育研究ステーション第24回研究会

The 24th Research Seminar of the Research Station for Innovative & Global Tertiary English Education (IGTEE), UEC Tokyo

【日時】令和3年11月4日(木)(Nov. 4, 2021, Thursday) 16:15 - 17:45 

【ZOOM MEETING】(申し込みフォームを参照)

Title: Corpora and Word Lists: How to Choose Academic Words

Presenter: Shin'ichiro Ishikawa    Kobe University

Abstract:

Corpora have been widely utilized for compilation of varied types of word lists. In this talk, I will briefly touch upon the history of corpus-based word lists. Then, I will introduce two kinds of recently developed wordlists: New JACET8000 (JACET, 2016) and BABILON2000 (Ishikawa, 2018). New JACET8000 is a general-purpose word list designed for college students in Japan. It is based on the frequency data from the British National Corpus (BNC), Corpus of  Contemporary American English (COCA), and a set of supplementary corpora including the texts that Japanese students are likely to encounter in the near future. Meanwhile, BABILON2000, which is intended to expand the Academic Word List (Coxhead, 2000), is a list of high-frequency and high-coverage academic words chosen on the basis of six key principles: BAlanced, Broad, Integrated, Lemma-based, and OpeN.


講演資料より

 

2021/11/02

2021.11.02 第1回中高生データサイエンスコンテスト表彰式

学長室で開催された表記イベントにオンライン参加し,最後に審査員として短い講話を行いました。最優秀賞の兵庫県立小野高校ほか,受賞校のみなさん,おめでとうございます。


表彰式(Zoom中継)

講評スライド