科研(萌芽)で構築していた日本語の小説コーパス「1961-2021 Japanese General Fiction Corpus」(略称6121 JFIC)がリリースされました。
★研究の記録はこちら。
これは,同一サンプリング基準でイギリス英語・アメリカ英語等の時系列調査が可能なBrownコーパスファミリーから着想を得たもので,1961年,1971年,1981年,1991年,2001年,2011年,2021年という7つのサンプリングスポットを定め,それぞれの年に刊行された三大文芸誌に掲載された日本語一般小説サンプルを収集したコーパスです。
自動翻訳ですが英語のデータも入っており,日英2か国語で検索をかけられます。これにより,日英語の小説の言語の比較や,各々の小説に具現化された「マインドスケープ」の計量的比較が可能になると期待されます。
コーパスエントリ画面(6121とICNALEの共通エントリ)
「作る」のコンコーダンスライン
「create」のコンコーダンスライン