このブログを検索

2020/08/25

2020.8.25 京都光華中学校・高等学校教員研修会

表記でアクティブラーニング導入にかかる講演を行いました。

講師:石川慎一郎(神戸大学)

(午前の部)講演:DAL を核にした新しい中高授業の創出

(午後の部)講話:DAL 授業を磨くヒント:~授業実践をふまえて~


当日は,Society 5.0につながる社会変容とその中で必要とされる新しい能力,また,新しい能力を育成する手段としての,思考創発型の「深い」アクティブラーニング(DAL)の重要性についてお話しました。講演後も熱心な質問があり,京都光華教育のさらなる展開と発展が期待されます。



一般に,「アクティブラーニング」というと,open-endな「自由に考えてみよう」式のものをイメージする方が多いのですが,実は,そうしたアプローチでは生徒の思考を深めることはなかなかむつかしくなります。むしろ,UbDの発想を組み込み,ゴールを明確に設定し,その達成を評価する手段を先に決めてから,アクティブラーニングのタスク設計(とくに問いの設計)を行うことが重要と言えるでしょう。


講演スライドより(※スライド中に引用した図版の典拠はこちら


2020/08/22

2020.8.22 「言語と統計2020」

8/24 記載 

無事に終了しました。約80名のご参加があり,対面の会と変わらず盛会でした。参加の各位に御礼申し上げます。

オンライン発表風景(神戸大M安さんの発表より)

・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・

最終更新日 2020/8/21

下記の要領で2020年度の研究発表会を実施します。

グループ外のみなさまの聴講希望も受け付けておりますので,ご希望の方はこちらからお早めにお申し込みください。(※定員に達しました。多数のお申し込みありがとうございます)


統計数理研究所言語系共同研究グループ2020年度第1回合同研究発表会
「言語と統計2020」(セミナーシリーズ Vol. 15)

日時:2020/8/22(土)0930~1700ごろ
形態:Zoom開催
指導講話:統計数理研究所 前田忠彦
事務局:神戸大学石川慎一郎研究室 iskwshin@gmail.com
聴講:無料。要申し込み。申し込みサイト(先着順)

(1) 各人15分発表(zoom上でのライブ発表予定)
(2) セッション内の全発表が終了後,セッションごとに研究討議。前田先生ご講評,聴衆からの質疑と返答など。
(3) 以下,発表題目は仮題です。当日までに変更の可能性があります。
(4) 参加者は出入り自由(再入場される場合はURLをクリックしてお入りください。司会・発表者以外は原則camera off/ mic offで)
(5) 聴講者の皆様からの質問・コメントはGoogle Formで収集します。いただいた質問・コメントは発表者に渡しますが,直接の回答ができない場合がございますこと,あらかじめご了承くださいませ。
(6) これまでの「言語と統計」開催記録についてはこちらをご参照ください。

プログラム(★修正があります★ 2020/8/21)

開会あいさつ 0925~ 石川慎一郎(神戸大)

第1セッション 0930~1100 (セッションチェア 石川慎一郎)
0930-0945 堀家利沙(神戸大学M)「日本人高校生と英語母語話者の統制英作文に見るgo+Xコロケーション:対照中間言語分析の観点から」
【概要】ICNALEの英語母語話者作文データと,同等のトピックで独自に収集した高校生英作文を比較し,高校生のgo+Xコロケーションの特徴を解明する。

0945-1000  佐々木恭子(神戸大学M)「高校生の英作文に見るbecause使用:頻度・文中位置の観点から」
【概要】JEFLL高校生英作文argumentativeデータとICNALE Written Essaysの母語話者データを用いて,日本人高校生と母語話者の意見表明作文でのbecause使用を量的・質的に比較し,形式に焦点を当てそれぞれの特徴を明らかにする。

1000-1015  中西淳(神戸大学D)「日本人英語学習者コーパスにおける前置詞誤用の記述的研究-at・in・onの基本前置詞に注目して-」
【概要】誤用情報の付与された学習者コーパスを用い,日本人英語学習者が誤用する前置詞at・in・onを調査する。

1015-1030  植田正暢(北九州市立大学)「意味クラスの情報を利用した二重目的語動詞の定量的分析の試み」
【概要】TBA

1030-1100 質疑応答

(休憩)

第2セッション 1110~1220 (セッションチェア 宮崎佳典)
1110-1125 石田麻衣子(神戸大学附属小/神戸大M)「小学生のための基本名詞コロケーションリスト作成手法の検討:ADJ/ N + schoolを例に」
【概要】小学校では様々な基本名詞を指導するが,多くは単語1語の提示のみにとどまり,そのコロケーションを示す機会はほとんどない。本研究は,小学校英語教育で扱う基本名詞について,主要なコロケーションパタンを網羅したリストを作成するという目的のもと,そのために必要となる手法を検討する。具体的には,COCAをはじめとする複数のコーパスを用い,「ADJ/N+school」の代表的なコロケーションパタンを特定し,教育的観点から評価を加える。

1125-1140 八野幸子(帝塚山学院大学)「理科との連携による教科等横断的視点を取り入れた英語教育のための語彙研究-植物に関する文脈に出現する語彙を中心に-」
【概要】2020年度より小学校教育においては新学習指導要領が完全実施となり、この学習指導要領においては、教科等横断的視点を取り入れた取り組みが推奨されている。
本発表では、理科との連携による小学校外国語活動・外国語科で利用可能な語彙について発表者編纂の植物コーパスを分析した結果について報告する。

1140-1155 石川有香(名古屋工業大学)「日本人工学専攻大学院生による国際Discourse Community参入の阻害要因は何か?」
【概要】TBA

1155-1220 質疑応答

<昼休憩>

第3セッション 1320~1450 (セッションチェア 藤枝美穂)
1320-1335  安美彦(神戸大学M)「日本語における条件節:名詞+「と・たら・なら・ば」の使用実態の計量的解明」
【概要】日本語書き言葉による「名詞+条件節」の使用を計量的に調査し,現代日本語における条件節の具体的な使い分けを大規模コーパスを用いながら解明する。

1335-1350  鄧琪(神戸大学D)「外来語とその類義漢語の使い分け:「ストップ」と「停止」を例にしたコーパス調査」
【概要】本研究は「現代日本語書き言葉均衡コーパス」を用いて、使用頻度、年代、品詞性、共起語などの観点から、外来語「ストップ」とその類義漢語「停止」の使い分けを明らかにする。

1350-1405  中尾桂子(大妻女子大学短期大学部)「BCCWJにおける論述系レジスターの「だ。」」
【概要】論述系の文章の中の「~だ。」で終わる文の使用状況を確かめ,論述内の断定的表現について考察する。

1405-1420  石川慎一郎(神戸大学)「日本語絵描写作文課題における使用動詞を手掛かりとした発達の段階性および習熟度推定の可能性―I-JASのSW1課題データを使った検証―」
【概要】I-JASのSW1課題に出現した動詞を手掛かりとして,クラスター分析により,学習者の発達過程における段階の推定を行う。また,重回帰分析により,動詞頻度を手掛かりとした簡易な習熟度推定の可能性について検討する。

1420-1450 質疑応答

第4セッション 1500~1605 (セッションチェア 小山由紀江)
1500-1515  肖錦蓮(神戸大学D)「書き言葉と話し言葉の差を踏まえた日本語重要ヘッジの抽出と陳述緩和機能の再考」 
【概要】本研究では、書き言葉と話し言葉に共通して出現する高頻度のヘッジを抽出し、母語話者アンケートで得られたデータをもとに、ヘッジの陳述緩和性について再考する。

1515-1530 張晶鑫(神戸大学外国人特別研究員)「日本語の「の」と中国語の「的」の比較研究:『中日対訳コーパス』を用いた計量調査」
【概要】日本語の「の」と中国語の「的」は置き換えられる場合が多いが,置き換えられない場合はしばしば問題が生じる。本研究は『中日対訳コーパス』を用いて両者の対応関係を計量化することを目指す。

1530-1545  井上 聡(環太平洋大学)「大学教育で目指すべき「遠隔授業ならでは」とは?」
【概要】令和2年4月,大半の大学が遠隔授業への移行を迫られる中,Twitterで「遠隔授業は質が落ちるので学費を返金すべきだ」との声があがった。本研究では,学生アンケートで得られた記述コメントをもとに,対面授業との違いに基づいて,「オンライン授業ならでは」の性質について説明したい。

1545-1605 質疑応答

第5セッション 1615~1700 (セッションチェア 岩根久)
1615-1630 黄晨雯(大阪大学D)「中国ミステリー小説をめぐる計量的分析ー程小青と鬼馬星の作品を中心に―」
【概要】本研究では、中国20世紀以降の著名なミステリー作家である程小青と鬼馬星の作品を対象に主成分分析やトピックモデリング手法を適用し量的分析を行う。

1630-1645 福本広光(大阪大学D)「19世紀小説における分離不定詞の頻度および用法に関する一考察」
【概要】19世紀アメリカ小説のデータを基に、分離不定詞の頻度変化の要因について分析したうえで、ケーススタディとしてMark Twain作品に見受けられる分離不定詞の特徴・用法に関して量的考察を行う。

1645-1700 質疑応答

1700 閉会

1700~1715ごろ 交流会(参加者間での自由歓談。希望者のみ参加)

2020/08/21

2020.8.21 学習者コーパス国際シンポLCSAW5 (2020)

2020/8/21 終了しました。
午前の部・午後の部あわせて,延べ160名のご参加がありました。多数のご参会に感謝申し上げます。

オープニング(1)


オープニング(2)(ICNALEの各モジュール開発と過去のLCSAWテーマ)

  ・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・

神戸大石川研究室では,科学研究費補助金の支援を受け,第5回のLCSAW(Learner Corpus Studies in Asia and the World)を開催いたします。

英語や日本語のL2学習者による産出の評価,および,学習者コーパス研究における評価データの扱いについてご関心のある皆様の聴講参加を受け付けております。聴講申し込みサイトより必要事項をご送信ください。先着順での受け付けとなります。

                 記

第5回学習者コーパス国際シンポジム LCSAW 5 (2020)

〇日時:2020年8月21日(金)午前9時50分~午後5時ごろ
〇形態:Zoom上で実施
〇主催:神戸大学石川慎一郎研究室(※科研費20H01282の支援による)
〇テーマ:「L2学習者の作文・発話をどう評価すべきか:学習者コーパス研究における評価データ収集の意義と課題」
〇開催趣旨:近年,各種の学習者コーパスがリリースされ,学習者コーパス研究(LCR)が広く実施されるようになってきましたが,研究の進展につれ,コーパスに含まれる作文や発話に対する直接的な評価データを求める声も強まっています。もっとも,学習者のL2産出物の評価については,何をモデルとすべきか,どのようなルーブリックを作るべきか,holisticとanalyticをどう位置づけるべきか,だれを評価者とすべきか,評価者をどうトレーニングすべきか,評価者の判断のブレにどう対処すべきか,アウトプットを見るべきか,あるいは,産出の背後にある意欲・態度・関心を見るべきか,人手評価と自動評価の関係をどう考えるべきか,学習者の習熟度・産出物の質・産出物の言語特性の3者の関係をどうモデル化すべきか,など,多くの論点が残されています。本シンポジウムでは,英語や日本語などのL2産出の評価に関わる研究者が各自の研究成果を紹介し,今後,この問題を考える上での見取り図を提供することを目指します。
〇発表言語:日本語,英語
〇論文集:発表論文集を刊行予定(2020年12月予定)
〇発表数:発表13本(招待8,公募4,主催者1),研究討議4本
〇聴講参加申込:参加費は無料。聴講申し込みサイトより登録。定員まで先着順で受け付け,ご参加いただける方には開催日の1週間前までに接続URLをお送りします。
〇問い合わせ:石川 iskwshin@gmail.com

1)発表順・発表題目・概要は当日までに変更の可能性があります。
2)招待発表(●)は20分,公募発表(〇)は15分です。
3)過去のLCSAWの開催記録はこちら,発表論文集はこちら

・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・

LCSAW 5 (2020) プログラム(7/21版)

0955~ 開会のことば 石川慎一郎

==================================
第1部:L2英語ライティングの評価
==================================
1000-1020
●小島 ますみ(岐阜市立女子短期大学准教授)
「L2ライティング力の予測変数:これまでどのような研究が行われてきたか」
第二言語(L2)ライティング研究者達は、学習者のライティング評価を予測するために、これまで様々な変数に着目してきた。それらの変数には、テクストの言語的特徴を始め、学習者のL2言語知識、適性や動機付けなどの個人差を含む。本発表では、これまでどのようなL2ライティング評価予測変数が着目されてきたかについて、経年的かつ量的に概観するとともに、今後どのような研究が必要かについて提言を行う。なお、本発表はライティング力と相関する要因を扱ったメタ分析の研究成果の一部である。

1020-1040
●川口 勇作(愛知学院大学講師)
「英作文評価と英語ライティングプロセス研究」
L2ライティング研究では、書き手のライティングプロセスと英作文の評価・書き手の熟達度との間に関連があるといわれている。英作文における評価とプロセスの関わりについて、現在取り組んでいる研究課題や、英語ライティングプロセスコーパス構築の試みなどを紹介しながら、学習者コーパス研究への貢献という観点を交えて議論する。

1040-1100
●小林 雄一郎(日本大学講師)
「L2ライティングにおけるL1の影響ーメタ談話の観点から」
アジア圏英語学習者のライティングにおけるメタ談話標識の使用傾向・発達傾向を比較し、L2の談話的側面の評価について考察する。

(休憩)

1110-1125
〇畔元(あぜもと) 里沙子(九州大学D)
「ICNALEにおける日本人英語学習者のコロケーション産出:母語の影響の観点から」
ICNALEにおける同一トピックでの日本人英語学習者と英語母語話者のコロケーション産出を比較し学習者の母語の影響についての考察を述べる

1125-1140
〇Jan Wira Gotama Putra(東京工業大学D)
「Annotating Argumentative Structure in EFL essays with TIARA
Writing good argumentative texts is one of the goals in education. It requires reasoning and effective framing of our opinions. But these skills do not come naturally, and thus need to be taught. This talk outlines our effort to automatize the analysis of argumentative structure in EFL essays (through the ICNALE corpus), which is useful for education. We introduce TIARA annotation tool that is developed for such tasks. 

1140-1220
研究討議1 「L2英語ライティングの評価をめぐって」
小島・川口・小林・畔元・Putraの各氏 (進行:石川)

1220-1310
昼休憩/意見交換会1(自由参加)

=============================
第2部 L2英語スピーキングの評価
=============================
1310-1330
●横内 裕一郎(弘前大学助教)
「CAF指標を用いたルーブリックの 構成概念妥当性(外的側面)の検証」
本発表では、ルーブリックの概念について説明を行い、さらに、実際のデータを用いてCAFの指標を使った構成概念妥当性の外的側面の検証を行う。その上でEBB scaleによる評価とCAFの関係性に見えてきた傾向を紹介する。

1330-1350
●猫田 英伸(島根大学准教授)
「高等学校での「話すこと(発表)」の指導の効果測定」
高校2年生を対象として1学期をかけて話すことの指導を行い、無作為抽出生徒30名の3時点(事前、事中、事後)での録音音声を、量、質の両面から評価、分析した。

1350-1405
研究討議2 「L2英語スピーキングの評価をめぐって」
横内・猫田の両氏 (進行:石川)

==================================
第3部 L2日本語ライティングの評価
==================================
1410-1430
●伊集院 郁子(東京外国語大学教授)
「作文コーパスの構築から評価研究へ:作文評価の普遍性と多様性を探る」
現在、コーパスから抽出した日本語意見文に対する評価データを収集し、評価を左右する要因を多角的に分析したうえで、意見文評価ルーブリックを作成し、レベル別サンプルとともに公開することを目指している。本発表ではその研究成果の一部を紹介する。

1430-1445
〇安達 万里江(関西学院大学講師)
「L2日本語作文の内容に関する評価研究 ―ルーブリック改訂前後の評定・評価理由の比較―」
本研究は,日本語学習者コーパス「I‐JAS」の作文3編を用い,日本語教員11名によるルーブリック改訂前後の内容に関する評定・評価理由データを比較する。

1445-1500
〇鄧 琪(神戸大D) 
「学習段階の変化が日本語学習者の外来語使用に及ぼす影響:「日语学习者书面语语料库」を用いた縦断調査」
本研究は「日语学习者书面语语料库(日本語学習者書き言葉コーパス)」を用いて,量と内容という2つの観点から,中国語を母語とする日本語学習者の作文における外来語使用状況の段階的変化の解明を目指す。

1500-1520
研究討議3 「L2日本語ライティングの評価をめぐって」
伊集院・安達・鄧の各氏 (進行:石川)

=============================
第4部 L2産出評価研究の展望
=============================
1530-1550
●近藤 悠介(早稲田大学准教授)
「学習者言語の評価に関する問題」
学習者のパフォーマンス評価に関して、発表者がこれまで直面したいくつかの問題について話します。

1550-1610
●李 在鎬(り じぇほ)(早稲田大学教授)
「計算モデルは,人の評価にどこまで近づけられるか」
コーパス解析によって得られた計算モデルで言語能力を予測する研究例を紹介する。具体的には,作文に含まれるテキスト特徴量から言語テストの得点を予測する研究,教師の評価を予測する研究を紹介する。

1610-1630
●石川 慎一郎(神戸大学教授)
「習熟度+産出+産出評価=?:学習者コーパス研究の新展開」
最近の学習者コーパスには,学習者の習熟度データを含むものが増えてきた。習熟度と産出のデータがあれば両者の関係をモデル化することができる。しかし,いわゆる「良い作文」や「良い発話」の構成要素を明らかにするには,これらに加え,産出に対する直接評価のデータが不可欠である。もっとも,L2産出の評価については,(a)何をモデルとすべきか,(b)誰を評価者とすべきか,(c)どの観点で評価すべきか,(d)評価のぶれをどう扱うべきか,といった古くて新しい問題が山積みである。本発表では,これらを整理しつつ,学習者の産出に対する直接評価データを体系的に収集するICNALE Global Rating Archive(GRA)プロジェクトの構想を示す。

1630-1650
研究討議4 「L2産出評価研究の展望をめぐって」
近藤・李の両氏 (進行:石川)

1650 閉会

1700-1730 意見交換会2(自由参加)

2020/08/12

2020.8.12 前期最終授業

 激動の(?)前期授業が本日無事に終了しました。遠隔授業の功罪についてはすでに多くのところで論じられていますが,実際に半年間やってみて,教員の予想を超えて学生の満足度が高いことに驚きました。

とくに私の授業では学部・大学院ともオンデマンド方式(youtubeにあげたビデオを期間内に聴講してレポート)にしたのですが,「何度でも見返せる」という意見のほか,「相手がビデオなので英語を発音するのも恥ずかしくない」(学部の英語の授業),「機器やソフトを使った演習などは対面授業より細部がよくわかる」(大学院の言語学授業)など,肯定的な感想が多かったようです。

ただ,学生は総じて課題に追われ,物をじっくり考えたり,人と対話を深めて思考を展開するという機会は少なかったようです。後期以降,神戸大は遠隔を「原則」継続の見込みですが,後期の私の授業では,許可がとれれば,若干の対面指導を加えられたらと考えています。


2020/08/11

2020.8.11 神戸大学附属小学校教員研究プロジェクト指導

表記のプロジェクトで,附属小学校の教員の方の国語の研究プロジェクトの指導をオンラインで実施しました。

このプロジェクトでは,子供たちの対話によって理解が進化するプロセスの解明を目指しています。指導では試行データを量的に分析し,3名の子供の発話内容の特性を客観的に抽出する処理手法などについて助言を行いました。

プロジェクトでは,アンケートデータと発話データの組み合わせ分析を行っていますが,試行分析でも面白い結果が示唆されました。よく話す子供は対話に満足感を持つが理解の深化は限定的。よく聞く子供は対話への満足感は低いが理解は進化し認識の更新が起こりうる,という関係がありそうです。


2020/08/01

【終了】2020-2024 [延長] 科研(萌芽:マインドスケープ研究)進捗報告

最終更新日 2024/3/31


2020~2022年度(※延長で2023年度まで) 科研(挑戦的萌芽)「言語から見た日米マインドスケープ比較:データサイエンス志向型小説研究の試行」(20K20699)

コーパスに収録する日本の三大文芸誌:『新潮』『群像』『文學界』

◎このエントリの位置付け
本エントリは,報告書「科学研究における健全性の向上について」(日本学術会議,2015年3月6日)の(2)-1および(2)-5アで指摘されている「研究ノート」の電子版として位置付けています。その都度の準備の状況・実験の過程・問題点などを時系列的に記録し,誤記の修正などを除き,過去の内容は変更しないこととします。

◎事業目的(科研申請時)
米語コーパスの原型とされるBrown Corpusの「小説セクション」のサンプリング基準を日本語に適用し,Brownと比較可能な日本語均衡小説コーパスを構築した上で,日米小説データの言語分析に基づく計量的マインドスケープ比較を試行する。

◎これまでの進捗(概要)
(2020年度)
7月 採択決定
8~9月 採択にかかる諸手続きなど
10~3月 研究手法の検討,Brown Corpus収録の小説作品の調査

(2021年度)
4月 本年度のスケジューリング
5月 大学図書館蔵書調査,収集対象決定,資料収集,文字化作業着手
6月 英語4コーパスの小説の整形+日本語化,日本語小説3年分のテキスト化,英語化
7月 日本語小説のテキスト化,英語化,形態素解析を進める
8月 検索システムの開発準備(業者打ち合わせ),英語POSデータ作成,出版社への告知
9月 検索システム開発契約,JAECS発表準備
10月 学会発表,検索システム開発継続
11月 検索システム開発継続
12月 検索システム用ウェブサイト開発,出版社に説明文書発送。
1月 検索システムの改修
2月 検索システムの公開,論文執筆,研究発表

(2022年度)
4~10月 論文執筆準備
11月 タグ付けの修正作業の検討(発注は2023以降)
12月 オンラインインタフェースのJASWRICとの共通化検討
1月 品詞タグ付け検証作業の見積もり依頼と発注
2月 1961データ検証作業
3月 1971データ検証作業

(2023年度)
4~8月 1981~2021データ検証作業
11月 日英語対応語彙表自動作成システムの構想と見積もり取得・発注
11月 更新後データによる差し替え業務の依頼
1月 更新後データについて作業指示ビデオを作成・送信
3月 データ更新作業完了、語彙表システム納品

2023年度の業務の記録========================================
JFICデータ更新作業経緯
1/13 ビデオで作業方針説明
1/25 ビデオ再送付の依頼あり
3/1 更新作業完了通知
 ・「品詞」が空のデータが数件ある
 ・「語彙素読み」は画面上で表示箇所がないため、今回は未使用
 ・「文境界」を以前はsentence区切りに使用していたが今回はデーターがなかったため、「。」をsentence区切りとして使用
3/2 検証の結果数字が合わないので連絡

3/2付け検証
3/2 先方よりベースファイル再送の依頼あり、対応。
3/8 問題の特定
「語彙素(ハイフン抜き)」の列にて、「書字形」がハイフンだけの文字の場合に空になっており、こちらが取り込み時の誤判断の原因に。「語彙素」を空で登録するのはシステム仕様上に影響がありそうなため、「―」ハイフンとして登録する。
3/18 本システムへの新規データ反映完了。納品処理。
==========================================


========================================
複数ファイルからの統合語彙表自動作成システム開発記録

システム画面

2023
5/23 A社に見積もり依頼
6/21 予算オーバーのため交渉を打ち切り
<開発の方向について検討>
11/6 B社に見積もり依頼
11/7 受託可との返答
11/8 日本語だけでなく英語の処理も統合したシステムとして発注
11/9 仕様書策定
11/20 口座登録など事務手続き完了
12/24 第1次モデルの完成
12/25 不具合発生

2024
1/10 対応完了
1/10 不具合解決せずビデオにて問題を説明
1/12 微修正後に再検証するが不具合が残りビデオにて問題を説明
1/22 修正対応、作業ビデオ作製
1/25 再修正
1/31 インタフェースの文言を作成して送付
2/5 対応完了
2/7 英語処理時のエクセルのトップシートへの情報記載の依頼
2/14 英語処理時のエラー報告
2/15 対応完了、行列転換処理の決定
2/19 英語のcase sensitive/insensitiveの切り替えを実装
2/21 大幅修正
-- 英語において単語以外を削除(ここで言う「単語」とは、a-z を最低1文字含む文字列)
-- ファイルごと、単語ごとの頻度、及び総頻度を集計、表示
-- 「レンジ数」の集計(出力では「ファイル頻度」と表記しました)
-- 全ファイルの合計単語の降順にソート(この結果シートごとに違う単語順になることに注意)
-- その他(列幅の調整、列の固定化などを地味に改良)
2/22 当方指示
1)日本語の場合も、タグで補助記号となるものは結果から排除してほしい
2)日本語に、謎の空白?が出ているので、これも出ないようにしてほしい
3)その他文言修正依頼
2/26 対応完了
2/28 会計上の納品処理
3/10 出力ファイルがコード順に並ばない問題を通知
3/16 検証後出てきた問題を連絡("part"と"part-"、"to"と"to."と"to-"が別語扱い、同じ語が別エントリに入っているものがある、myなどレマ化されていないものがある、数があわないものがある
3/18 対応通知あり、数字と記号をスペース扱いにするよう依頼
3/19 対応あり、アラビア数字を外す処理依頼
3/20 英語コーパス学会ESP-SIGでお披露目発表
3/21 日本語の「~」が単語認定されている件の修正を依頼
3/24 語彙素の犬、いぬ、イヌがまとまっていない問題の修正を依頼
3/25 対応通知
~以後の修正などは、継続科研である基盤B(WE22科研)で対応~

==========================================

◎プロジェクトの作業指針と概要(2021年12月更新)

<日本語モジュール(メインモジュール)構築>

(1) サンプリング方針
・日本の主要文芸誌3種を母集団とし,Brown Corpusの資料収集年次である1961年を起点として,10年ごとに文芸誌掲載の小説テキストを収集する
・データを取るのは対象年次の1月号とする(ただし神戸大図書館に欠本の場合に限って,2~3月で代替する)
・3雑誌あわせ,対象年次ごとにとる作品数は,Brown Corpusの小説(general)のサンプル数(29)を参考にして,31を基準とする(※+2とするのは問題があった場合に後で削れるように)
・ジャンルはBrownで言う「K:一般(general fiction)」とし,内容分類は行わない
・長編・短編の数の意図的なコントロールは行わないが,各号には,読み切り中編・短編のほか,長編連載の一部などが掲載されるため,母集団に対して自然な分布となる。
・文学評論・座談会・短報などは取らないが,日本の私小説の伝統もふまえ,5000字を超える文学的エッセイは対象に含める
・1テキストは5000字(※Brownは英文2000語)を原則とし,文の途中で会ってもそこで打ち切る。字数はエディタ「秀丸」による(全角空白を含める)。
・ただし,(a)(年次ごとの規定のサンプル数を満たす上で必要な場合は)4,000字以上のものを(全体の10%未満まで)含める,(b)5,000字で作業後,コピー時の読み取り不良個所(ページの中央近傍)を補綴することで5,000字を若干超えるものが出ることは許容する

秀丸の語数のカウント事例(全角空白を含めて5,000字)

・収集したデータはDeepLとみんなの自動翻訳でAIによる英訳にかけ,英語からも検索できるようにする。AI翻訳の内容は手作業で修正しない。


(2) 収録サンプル数(2021年8月17日現在)
___________________________________________________
年号    文學界(BG) 群像(GZ) 新潮(SN)  合計
____________________________________________________
1961               8                10       13               31  (済)
1971               10               11                10                31 (済)
1981               12                8                 11                31 (済)
1991               11               10                10               31  (済)
2001       8                15                 8               31   (済)
2011      13               7                 11               31  (済)
2021                8                 8                 15               31  (済)
____________________________________________________
合計       70               69                 78              217   ____________________________________________________
・1991-SNの英語原作翻訳はデータからカット(7/8付け)
・1971-SNは3月号からデータ取得(1月欠本,2月三島特集)
・2001-BGは1月号から4本,2月号から4本


(3) 日本語小説の書き起こしにかかる処理ルール(2021/7現在)
______________________________________________
・テキストは1作品ごとにファイルを分けて入力
・ファイル名はPDF内記載のコードで入力
・文字数はカット記号の★込みで全ファイル5,000字で統一
・文字コードはUTF-8で入力
・題名・作者名などは省略
・段落頭のアキは原稿通り
・文章段落頭以外の小見出し、番号、字下げ箇所、地付き文字などはすべて詰めて入力
・空行(空改行)は1行分のみ入力
・括弧記号は全角で入力
・アルファベット略号は全角で入力
・横書きの欧文は半角で入力
・算用数字は1桁を全角、2桁以上を半角で入力
・旧かな・旧漢字は新字体で打ち直して入力
・打ち直しの判断に迷った箇所は原稿通り入力
・くの字点・踊り字「ゞゝヾヽ」はひらがな・かたかなで入力
・一部の環境依存文字、旧字体・正字、Unicode文字は新字体・拡張新字体で入力(例:躯、掴、など)
・単独で判読できない文字は■(黒四角)で代用
・ノドの黒い部分で判読できない行、途切れている行は前後に1行あけて★印を行数分入力
_________________________________________________


<日英対照研究用英語小説モジュール(当面非公開)>
・LOB/Brown/FLOB/FROWN/CLOB/CROWNの小説(general)を収集
・タグを抜いてプレーンテキスト化,日本語化
・日本語モジュールとの対応上,足りない部分は今後埋めていくことを予定

____________________________________________________
年号  国  元コーパス  サンプル数          日本語訳作成
____________________________________________________
1961    US         Brown            29         済
1961    UK         LOB               29         済
1992    US         Frown            29         済
1991    UK         FLOB              29          済
2009    US         CROWN          29         未
2009    UK         CLOB              29        未
________________________________
・北京外大で構築されたCLOB/ CROWNは,2021/7現在,DLができなくなっている(CQP Webでのみ公開されている)
・過去に石川研究室で保存していたデータをモジュールに仮に編入(※製作者と権利関係の相談を予定)


◎月次報告

(2023年4~8月)
4/3 1971検証終了報告
4/26 1981検証終了報告
5/31 1991検証終了報告
6/5 2001検証終了報告
6/29 2011検証終了報告
8/3 2021検証終了報告と、ファイルマージ依頼。→マージ処理+形態素列でのソートをこちらで作業して作業者に返送。最終検討(同一形態素への別品詞割り振りがないかのチェック)の依頼

(2023年3月)
3/6 作業者より1961検証データの仮納品
3/17 研究期間の延長の承認あり

3/19 作業者より1971検証データが納品、当方で確認の上、会計処理に回す


(2023年2月)
2/2 トライアルデータへのフィードバックをまとめ、作業手順説明ビデオを作り、作業者に連絡

2/6 作業者よりビデオ視聴の確認あり、再トライアル送付、謝金確認要請
2/7 再トライアルへのフィードバック返却
2/8 上記確認着信と、新スケジュールの連絡あり
2/28 作業者より1961検証データの中間報告あり、チェックしてOKだし

(2023年1月)
1/23 タグ付け検証の見積もりが到着
1/23 今年度分として1961/1971の検証を依頼
1/24 会計打ち合わせ、システム入力、科研プロジェクトの延長申請、検索システムの修正のための現在インタフェースの確認
1/25 インタフェース日本語化と修正指示を送付

1/26  インタフェース修正案受領
1/27 同上フィードバック送信

1/30 語彙素の修正作業について新マニュアルを作成し、作業者に連絡
1/31 上記について確認。行コードの追加など。作業者とメールをやりとりし、細かい仕様を固めていく、web茶まめ優先、を基本方針として。

(2022年12月)
12/10 インタフェースの改修について見積もり作成依頼


(2022年11月)
11/14 国立国語研究所にタグ付け修正作業者の紹介依頼

(2022年3-10月)
論文執筆準備、タグ付け修正方法の検討

(2022年2月)

・2/1 業者より1/26の当方依頼と照会についての対応報告。
・2/9 記号タグ付けのエラー個所を特定。」――という文字列がなぜか名詞に登録されていた。そのほか統合トップを作成。業者に作業継続を依頼。
・2/16 JFICを紹介する論文を執筆。終助詞をテーマに。
・2/17 論文ほぼ完成。
・2/18 業者と連絡。検索システムの本番サイトでの駆動を確認。研究会用に検索システムの使用ガイドを作成。その過程で,ウェブサイトの誤記を発見し修正。
※「|」はデータのセパレータだが,検索ボックスに入れる際にはORの意味となる。
※コロケーションは半角スペースで。
・2/20 学習者コーパス研究会で発表。JFICを紹介。



(2022年1月)
・1/8 出版社からの異議申し立て期限(1/7)が経過したため作業を再開
・1/9-10 Guideページの修訂,日本語での検索のやり方をしめす注記を新規に作成

・業者宛に追加の対応依頼をまとめて送信する
・・・・・・・・・・・・・・・・・・・・・・・
(1) 全検索画面共通:Text の欄の DeepLRをDeepLに修正する
(2) KWIC,Collocation,Freq Graphの検索画面内のYear/ SourceをすべてDataに修正する(※そのほかの画面はすでにDataになっているのでこれで不統一解消)
(3) KWIC画面,検索語ボックスの横の?マークについて。英語のポップアップはそのまま。日本語はポップアップではなく下記へのリンクとする
http://language.sakura.ne.jp/jfic/guide.html#jpn_search
※あわせて小生記載の内容,誤解がないか貴職のほうでもご確認くださいませ。
(4) Wordlist検索条件画面
Numberの横の数字がセルの上部にくっついているのを修正
 (5) Wordlist検索条件画面:LemmaをLemma/ Morpheme に修正する(英語だとレマといいますが,日本語だと似た概念は形態素になるため)
(6) Wordlist結果画面
 ★画面上部のtypeとtokenはそれぞれ用語解説へのリンクですが,表ヘッダのWordとRaw Frequencyはリンクではなく,並べ替えのソートキーになっています。この違いが分かりにくいように思います。また,▼の意味も初心者にはわかりにくいかもしれません(ここにしかボタンがないのでこの▼記号をプルダウン表示と勘違いして押しそうになるが押しても何も出ない)
★ついては,ヘッダはリンクなしのWordとRaw Frequencyの記載だけ(PMWと同じようにする),その上に,Collocation結果画面の統計値切り替えボタンのように,Word ▲ Word ▼ Freq ▲  Freq ▼の4種のボタンを配置し,いまどれが選ばれているのかがわかるような画面の工夫,お願いできないでしょうか? 4つのボタンの左横にはSort Key:のような言葉があるとわかりやすいかと思います。
(7) コロケーション結果画面でのtスコアですが,絶対値で表示(マイナスの場合はマイナスを出さない)ように対応いただけますか? 
(8) Freq Graphの結果画面:下記に出ているグラフのヘッダの in the written textsは削除でお願いします
(9)Freq Graphの表示語数の検証:1961年の3冊で「行く」を調べる
※下記,2022/1/10時点では,やはりPMW調整はかかっていないようですが確認いただけますか? (当方の誤解ならすみません)
素頻度(検索システム上) 総語数(句読点など除く,Wordlist画面で確認) 計算上のPMW値 Freq Graph表示のPMW頻度
BG 57 26174 2177.7 57
GZ 165 33459 4931.4 165
SN 144 43454 3313.8 144
(10) Collocation結果画面/Keywords結果画面
現状,句読点や空白がこちらにも出ています。Wordlistで対応をお願いしたように,Collocation,Keywordsについても句読点・空白類は削除して普通の語のみを表示,でお願いします。
・・・・・・・・・・・・・・・・・・・・・・・・・・
「行く」をサンプルに手元のベースデータとの頻度一致確認

サンプル語「行く」の頻度に関してベースデータとオンラインデータの一致を確認

・1/11 業者よりNumberの縦ずれについて照会あり,EdgeとChromeで同時発生を確認して返信。使用している図版(書棚)のライセンスを再確認。Photo ACにおいて「写真ACの写真素材は、フリーダウンロードできます・・・商用利用もOK・・・クレジット表記や許可も必要ありません」の記載を確認の上,会員登録してダウンロードして使用(1/11付け)
・1/12 業者より対応返信。ほぼすべて解決。残った問題点を同日中に返信。
  (9)Freq Graphの表示語数の検証(PMWが合わない)
  (10) Collocation結果画面/Keywords結果画面における記号の削除(記号がなお残る)
・1/14 業者との調整でPMWのズレの原因になっていたWordlistでの記号のカウント問題が解消。記号について形態素解析誤解析によるものと判明。調整の結果1月~2月10日にかけて本番環境に移行することに。
・1/26 下記のページを新設
業者に連絡し,ICNALE都の切り分け調整を依頼。統合トップ→ICNALE/ JFIC分岐が必要。


(12月)
・12/7 業者より定時の進捗報告
 ・Freq Graph/ Keywordの調整完了
 ・Keywordの指定画面の調整
 ・POSに関する説明や機能の実装
 ・処理速度はスペックの高い本番への移行(リリース)後に再確認
・12/15 挙動検証・業者にフィードバック送信,ウェブページ作成着手

★フィードバック項目

0)全体に追加するアイコンボタン:Guide Works  Copyright

1)全体の修正
×Subaru → 〇Shincho
×Year of Publication → 〇Year/ Source
×Texts to be analyzed → 〇Text
×English Trans (DeepLR) → 〇English Trans 1 (DeepLR)
×English Trans (NICT) → 〇English Trans 2 (NICT)
×1961(S36)など年号すべて  →〇 1961 (S36) (※半角空白を入れる)
×Data Sources→〇Source (Dataとる,単数形)
※画面の一番下のCopiright 2015- → 2022-

2)各画面デザインの修正
KWIC/ Collocation
・Caseの列を追加(Wordlist画面同様英語の場合以外は選択できないようにしておく)
Collocation
・デフォで全選択に
Wordlist
・Numberの20の部分に上下センタリングかける(他の画面と同じく,画面を小さくしても行の中央に配置されるように)
・デフォでは全選択に
Freq Graph
・ComparisonをYear/ Sourceに変更
・Year/ Dataの選択ボタンは取る(要確認)
1行目 Source (デフォルトは全選択)
2行目 Year (デフォルトは全選択)※または左右配置でも可
Keywords
・Targetの左セルをその下のセルと結合。Targetと同じ行の左にYear/ Sourceが入る

3)機能別
A)KWIC 日本語の検索対象指定方法
=================================
本  "本"
今日|昨日  "今日" and "昨日"
本.[名詞*]  "本" (名詞*)
その [名詞*] を  "その なか を"/ "その 手 を"/ "その 本 を" etc
私|僕 [名詞*] は  "僕 今日 は"/ "私 自身 は"/ "僕 自身 は" etc
==================================
・「今日」と「きょう」と「キョウ」を同時に出すには? (語は同じで表記形がいろいろ)
・「私」と「わたし」と「ワタシ」を同時に出すには?(同上)
・「私」と「わたし」と「ワタシ」と「俺」と「おれ」と「我」と・・・・を同時に出すには?(形態素)
・名詞全部を出すには?
・POSボタンを押しても[  ]が出ないがこれは手で入れる仕様?
・本.[名詞*] の意味は,名詞の本を探すということ??

B)コロケーション
・デフォルトで何かが出てくるがそれがどの統計値の結果かわからない(デフォでも色をつける?)
・統計値を切り替えたとき,ボタンの色がすぐ変わるようにできないか?(現状,全体結果が再表示されるまで長い時間がかかるが,統計値のボタンの色の切り替えが起こらないので押せていないのではと何度も押す羽目になる)
・依然として時間がかかる
・tスコアの計算は正しいか?(マイナスが出る)
例 61の3冊のみ指定 「今日」で検索 「に」頻度1,統計量-0.10??
・英語の場合,コロケーションで出てくるターゲット語の頻度がKWICの結果とあわない
例 61の3冊のみ指定。DeepL指定。「today」はKWICでは全22例。コロケーションでは全24例。(大文字扱いのズレ? Caseの行をそれぞれに入れることで解決?)
※日本語でやると「今日」はどちらも29例ずつでそろう

C)単語リスト
・「、」「。」「「」」「ー」「空白」などが語としてカウントされているが,記号類・空白は排除。※PMW処理時の総語数への影響を考慮 (英語だとピリオドや記号は出ない)

D)頻度グラフ
・頻度はPMWと書いているが実際にはPMWになっていないのでは?

E)特徴語
・たとえば1961年vs全年代で比較しようとすると「It overlaps with the reference origin referrinh ahead」という注記が出るが,これは問題ないので可能にするように。(部分vs部分,部分vs全体,どちらの比較もOK)

・12/16 業者より返信。POSタグの[ ]自動挿入はICNALE含めて対応することに。当方より,追加で,KWIC出力画面他で,キーワードおよび隣接語の境界記号を入れるよう依頼。例:友達|と|小  学校 に  |行く| → |友達|と|小| 学校 |に|行く|。昨日作成のウェブサイト,画像が出ない問題を確認。解決方法を模索中。
・12/18 出版社用の検索システム説明文書を作成。各社に事前確認依頼のため発送。何かあれば1/7までに連絡を依頼。

依頼状,前回依頼状の控え(8/17),検索システム説明文書,返信封筒を発送。


出版社用検索システム使用説明書

・その後,ウェブサイト(解説の飛び先)の作成。いちおう公開にこぎつける。

ウェブサイト(検索フォームから飛んで解説等を表示する)

・12/16 追加依頼(キーワードの| |単語区切りの不揃い修正)
・12/23 追加依頼(新規作成guideへのリンク先の誘導の依頼)
・12/24 業者からの対応レポート届く,支払い関係の調整



(11月)
・11/5 月次進捗報告確認。データベースの格納まで終了
・11/6 keyword検索時の言語設定,日本語表示時の形態素区切り表示について業者に指示入れ。
・11/15 進捗報告。日本語表示エラーの改善中。当方よりの指示。(BCCWJ準拠)
(短い文脈)KWIC表示 ・・・ 当該形態素を中心に前後20形態素(全体で40形態素)
(長い文脈)KWIC表示で当該行をクリックするとポップアップで表示・・・当該形態素を中心に前後30形態素(全体で60形態素)
・11/22 限定データで結果が表示されるようになる
・品詞分析の基本的なシステムもほぼ完成


・今後の改善
・文字数の縮小ないし幅を広げて行のまたがりをなくする
・作品情報へのリンクの付与
・複数条件の重複指定
・11/29 進捗報告と検証
(問題点)DLデータのduplicateが見られる。表示時のセンタリング固定について。

参考メモ(11/29にテスト実施)
サンプル語「今日」で検索。★はduplicate可能性あり。
年号 原文  DL     NICT
61:29件/   23件/    22件
71:32件/  58件★/  28件
81:20件/  28件/   14件
91:21件/  40件★/  17件
01:18件/  32件★/  17件
11:26件/  40件★/  20件
21:20件/  12件/   7件


(10月)
・10/1 検索システムの導入画面(ベータ版)完成。ICNALEとログインを分岐。


共通のエントリーページ

JFIC独自のログイン

JFICの検索画面


10/2 英語コーパス学会でJFICについて発表
10/5 文芸家協会に再度メールで督促
10/5 文芸家協会より返信あり。担当者退社ということで個別作家への挨拶状の転送については否定的な感触。取次不可なら一方ほしいと連絡。
10/13 システム業者に提出するデータ形式について確認依頼。
10/14 業者よりデータ提出の要請。日本語については形態素解析データを送信。
10/15 昨日より2種の英訳データにタグ付けを実施。
作業メモ
 (1)Sketch Engineに個別ファイルは100まで送信可
 (2)Sketch Engineの出力(vert)をコピーしてExcel上でペーストした場合,一部のデータのcsvがが壊れることが判明(ファイル後半部)。したがって次のファイルのヘッダ行が落ちる。
  (3) 各種実験の結果,Excel→開く→UTF8指定してExcelに取り込むとうまくいくことがわかる。
 (4) EMN/ EDLともやりなおし
 →10/15に作業終了。データを業者に送信。あわせてPen Treeのタグに和訳も付与して業者に送付。

<doc でヘッダが入る →一時処理は100本まで。

(9月)
9/15 出版社の確認期限到来(支障の連絡はなし)
9/10 検索システム開発契約
_________________________________________
開発スケジュール
1・〜 9月末
 →全体的な今回の追加ご要望に関するシステム側の設計と仕様の確定
 →TOPページと、各種検索の一覧 / 詳細画面のレイアウトの構築
  →HTML側でみられる状態まで。
2・〜10月前半
 →プログラムは未完了だが画面は見られる状況に(フィードバックなど)
3・〜10月末
 →画面を元にプログラム開始  〜  KWIC検索や、FreqGraph検索まで
4・〜12月中頃まで(おそらく前倒し可能)
 →残りのCollocation、Wordlist、Keyword検索関連と全体含めたフィードバックの予定で進行。
____________________________________________

9/17 著者宛の手紙発送について日本文芸家協会に連絡(157人217作品→1人平均1.38本)
9/20 JAECS論文の微修正
9/22 JAECSプロシ―を公開
9/22 文芸家協会に状況確認の督促メールを発送
9/23 検索システムについてエントリページのデザインを作成・業者に発送 


9/23 業者よりICNALEとの切りわけに経費上難色が示される
9/24 切り分けを再度要請。対応の返事あり。

          
                 分岐用画面のイメージ

9/29 文芸家協会にTelするがテレワーク中でTel対応中止中とのこと。再度フォームより連絡を入れる。JAECS発表用のパワポ作成,発表ビデオ撮影。

発表ビデオ(開始部)

(8月)
8/1 7/31作業にミスを発見。MNでの英訳時に,2001SN4と2001SN6を処理すべきところ,2021SN4と2021SN6を処理していた。→新規に2001のSN4とSN6をMNで処理し,MNフォルダに上書き
8/3 2011モジュールが納品。会計処理。
8/6 ICNALEの検索システムをベースに検索のモックイメージを作成。業者に送付し,見積もり依頼をとる。
8/10 開発業者とのメール質疑
8/10 Sketch Engineでタグ付け。vertファイルを個別にDLすることができなくなっていることを確認。開発業者に連絡。DLできないのは仕様とのこと。

(サポートの回答)
It is not possible in the interface. The solution would be for you to download the whole corpus and then split it to separate files by simple command in the command line, which could for example look something like this: csplit name_of_the_file_with_whole_corpus.txt '/doc id/' '{*}' .

8/11 開発業者とのZoom会議(1000~1020) 英語のPOS解析データについて,前回システムと同等での提供が可能であることを確認。
8/12 研究室で作業。2011データの英訳作成,形態素解析データ作成。日本語形態素データの統合エクセルを修正(v2に)。連番のふりなおし,年号列,雑誌名列を新設。


群像(GZ)がGNとなっていたエラーを修正。あわせて,年代別に品詞列のデータと形態素列のデータを作成。品詞については最初の列にA-B-Cの形で情報が付与されている。Antconcでは記号を認識する設定にしないとまとめて処理できない。形態素についても,アメリカ-america,私-代名詞のように意味確定(disambiguation)のためのタグがついているのでAntconcでは同様の処理が必要。JAECS論文用に,高頻度助詞を用いた分類を試行。

助詞をアイテムとしたときの70年分データの布置

※1961~1991のかたまりと,2001~2021のかたまりにわかれる。作家が世紀の分かれ目を意識したというわけではもちろんないだろうが,助詞使用は世紀の切れ目でちょうど質的に変化している可能性がある。
8/13 JAECS用の予稿論文を執筆。
8/14 上記をいちおう完成(8p)。
8/16 上限が6pであることに気づき,修正作業。内容を圧縮して6pに。(1か月ほど寝かして再チェックして投稿予定)
8/17 各出版社への通知文を作成。また作品台帳をアップデート。各社への引用作品リスト送付の準備を行う。1700 発送完了。

3文芸誌にコーパス収録を通知

8/20 システム開発業者より見積もり遅延の通知。
8/21 研究ネタメモ:「日本語学習者の作文の文体は教科書が執筆された年代の文体に影響されているのではないか?」調査
8/24 新潮社より確認通知をいただく。


(7月)
7/5 
・1971-新潮1月号(文学部から取り寄せ)を複写
・1981-新潮/文学界/群像を借りだして複写
・自宅で1971の3セット,1981の3セットをスキャン
・フルで取ると1971は32本,1981は43本。これまで31~32本で取っているので,1981はテキスト化の作品を絞る。
・現時点のデータの構造(3文芸誌,太字はテキスト化済)1961/1971/1981/1991/(未2001)/(未2011)/2021
・英語化について再検討:Deep L翻訳は訳せるところはこなれた良い翻訳になるが,一方で,同じ原文に対して表現の異なる訳が複数列挙されていたり(訳文a,訳文b,訳文cなどが並ぶ),原文の訳し飛ばしが非常に多い
・人手翻訳が理想だが,editageに翻訳させると5000字で65,000円(13円/字)。1年あたり30本として200万弱(3年600万)なので,これは予算的に不可。
・Deep L翻訳とGoogle翻訳(訳は不自然だが飛ばしはしない)を両方使う? NICTの「みんなの翻訳」に登録。テストデータで出力実験。

7/7
・サンプルデータのエクセル台帳への登録作業を実施
・1981年データ(B16/ G12/ S15=43件)より12本を削除(コードは元表記)→31本
(a) 1981年内で重複している作家について一方を削除(4本)
  81-G-02(中里恒子)
  81-G-04(芝木好子)
  81-S-10(中上健次)
  81-B-04(水上勉)
(b) 他の年代と重複している作家(18本)のうち全体が3件以上になる作家を削除(5本)
  81-S-01(遠藤周作)
  81-S-08(田久保英夫)
  81-S-11(円地文子)
  81-G-05(大原富江)
  81-G-12(小島信夫)
→以上を除去した場合,B=15,G=8, S=11となり,Bが多い。
(c)他の年代(1回)と重複している作家のうち,Bの掲載分を削除(3本)
  81-B-01(庄野潤三)
  81-B-02(阿川弘之)
  81-B-03(芝木好子)
→以上を除去した場合,B=12,G=8, S=11,全体30となる。

※削除対象12本リスト
  81-B-01(庄野潤三) 02(阿川弘之) 03(芝木好子) 04(水上勉)
  81-G-02(中里恒子) 04(芝木好子) 05(大原富江) 12(小島信夫)
  81-S-01(遠藤周作) 08(田久保英夫)10(中上健次) 11(円地文子)
→これらを除いて,連番を振り直し
→元コピーから12本を抜いてスキャンを取り直し

7/7
・1971/1981データの書き起こしを発注(作業1か月程度)

7/8
・2021の日本語データの英語化作業
・データの不足する3本のうち,連載の2本は継続号から補充することに(※来週の月曜に図書館で作業予定)
 21-G-03 【4473/ 4294字】こんにちは赤ちゃん  →ママ(最終的にボツ化も検討)
 21-G-07 【3653/ 3617字】硝子万華鏡(第4回)→2月号から約1400字補填
 21-S-11 【4941/ 4852字】漂流(連載19)→2月号から60語程度補填
・CLOB/ CROWNについての情報の整理(※現在DLサイトが停止中)

7/9
・2000年以降のデータを含めるようになったことと,翻訳システムを二重化する(DL+Google)可能性が出てきたことを前提に,ファイルネームのルールを修正。一括変換。
旧:EJ-61-US-01 (オリジナル英語,日本語訳,1961年,米国,通番01)
新:E-JDL-1961-US-01 (オリジナル英語,DL(Deep Learning)による日本語訳,1961年,米国,通番01)
・Google翻訳でUKデータの日本語訳作業を行ったが17本で受け付けられなくなる・
・NICTの「みんなで翻訳」(汎用エンジン)に切り替えて訳文の作成

個々のテキストごとに反訳の再現率が出る(70%程度のものが多い)

【英語原文(1961-UK-01冒頭)】   
'Are you sure you're quite fit?  It's terrible weather.  '  He turned round to face his colleague. For some esoteric reason Fairbanks always completed the buttoning of his flies in the main area of the lavatory.   'Good morning, Harold,  ' he said.   'I'm pretty chipper, thanks, considering.  '
【みんなの翻訳】
「あなたは本当にぴったりですか。ひどい天気ですね。」彼は振り向いて同僚に向かった。
いくつかの難解な理由で、フェアバンクス駅はいつもトイレのメインエリアでハエのボタンを留めていた。「おはよう、ハロルド。」と彼は言った。「ありがとう、考えてみると、私はとても頭がいいんだよ。」
【DeepL翻訳】
   「本当に体力があるのか? ひどい天気だよ」。 と言って、同僚の方を振り向いた。何か難解な理由があって、フェアバンクスはいつも便所のメインエリアでズボンのボタン付けを済ませるのだ。  おはようございます、ハロルド」と彼は言った。  私はとても元気だよ、ありがとう。 
★コロケーションなどはある程度取れており検索補助としては実用レベルか?

【日本語原文(2021-BG-01冒頭】
今日はおれの誕生日だった、おれは十七歳になった、セヴンティーンだ。家族のものは父も母も兄も皆な、おれの誕生日に気がつかないか、気がつかないふりをしていた。それで、おれも黙っていた。夕暮に、自衛隊の病院で看護婦をしている姉が帰ってきて、風呂場で石鹸を体じゅうにぬりたくっているおれに、《十七歳ね、自分の肉をつかんで見たくない?》といいにきた。
【みんなの翻訳】
Today was my birthday, and I was seventeen years old, Seventeen. All the family members, father, mother and brother, either did not notice my birthday or pretended not to notice it. So I kept silent. At the end of the evening, my sister, who is a nurse at a Self-Defense Forces hospital, came back to me, and I was rubbing soap all over my body in the bathroom. Seventeen years old, don't you want to grab your flesh and see it?
【DeepL翻訳】
Today was my birthday, I turned seventeen, I'm a seventeen year old. Everyone in my family, my father, mother, and brother, either didn't know it was my birthday or pretended not to. So I kept quiet about it. At dusk, my sister, who worked as a nurse at a Self-Defense Forces hospital, came home and asked me, "You're seventeen, don't you want to grab your own flesh and see what it looks like?

統合検索例(英語:Original+MN英訳=209本における"young woman")

冒頭コードがEのものは英語原作,Jのものは日本語原作


7/10
・1961/91/2021の日本語小説形態素解析済データを1ファイルに統合。30万行のエクセルファイルとなった。

・この形になっていれば,経年変化,語種分析など,対応性広く有益。この後,作品コードに加え,著者名,生年,性別情報などを追加。
・基本指標について60年間の増減を調査
・接続詞は減る,句点も読点も減る,漢語は1割,外来語は2倍増える!

7/12
・図書館で下記の2点について2月号の次号連載冒頭を補充入力
  21-G-07 【3653/ 3617字】硝子万華鏡(第4回)→2月号から約1400字補填
  21-S-11 【4941/ 4852字】漂流(連載19)→2月号から60語程度補填

7/13
・2011年の雑誌が図書館にないように思えたので,レファレンスに照会を出す
...............................................................................................................
石川です。科研プロジェクトの関係で,文芸誌の「群像」「新潮」「文学界」の3種について,2011年1月号および2月号をお借りしたく存じます。ただ,現在,貴館においては,これらの雑誌は「最新1年分:開架室3F-雑誌コーナー / 過去2年分:倉庫に保管(カウンターでお尋ねください) /1950-2005は書庫雑誌」という記載がなされていますが,2011年1~2月分は,過去2年分ではなく,かつ,2005年以降なのですが,これらは所蔵されていないということでしょうか?あるいは借りだし可能でしょうか?
................................................................................................................... 

7/14
・所蔵なし,との返答(なぜなのだろう。1960年代(以前)から継続収蔵してきたものがこの10年で突然途切れたというのは大学図書館として考えられない…)。amazonの古本で即時に発注。
・1971年版納品

7/15
・大学で1971年版の現物との照合作業。今回はページ境界などが黒くなっている個所はなく,★,■記号は確認されず。

7/16
・1971版は32あるため1つ削る。
・同年で2つ入っているのは吉行淳之介と小島信夫
・他年を加えた合計でもともに61/71/71の3本
・どちらかを落とす根拠がないので50音順で小島の1つを落とす(長短編バランスから連載のほうを残す)
  71-B-02 観客 
  71-G-08 別れる理由(その28)(「町」第37回)
・上記に伴い71のBGの連番の修正実施
・1971年版のDeepL英訳作成作業完了
・同上のみんなで翻訳英訳作成作業完了
・同上web茶豆での形態素解析,形態素台帳転記作業終了
・増補分のデータの差し替え
   21-G-07 【3653/ 3617字】硝子万華鏡(第4回)→2月号から約1400字補填
   21-S-11 【4941/ 4852字】漂流(連載19)→2月号から60語程度補填
・DeepL訳,みんな訳,web茶豆,の3点セット処理。形態素台帳の旧データを削除して新データで差し替え。全体をソートしてsequence numberを割り付け。

7/17
・作品台帳の欠損データ(開始ページ数)を補填,連載にコードを付与,連載の連番表記を統一

7/22
・1981年版が納品。即日支払い処理完了。
・1981年版について2種の英訳を作成。

7/23
・1981年版について形態素データを作成。

7/24
・英語コーパス学会の口頭発表に申込。____________________________________________________________

1961-2021日本語小説コーパス」の構築:日英小説対照研究の新しい可能性
"1961-2021 Japanese Fiction Corpus" : For a New Comparative Study of Japanese/ English Fictions
構築中の「1961-2021日本語小説コーパス」について報告する。これはBrown Corpusの標本抽出年である1961年を起点として,2021年まで,10年ごとの間隔で3大文芸誌(「新潮」「文学界」「群像」)に掲載された日本語の小説とその英訳(機械翻訳2種)を収集するものである。本コーパスは,60年間にわたる日本語の表記・表現・文体の変化の研究に活用できる。また,付随する英訳データをBrown/ LOB1961年),Frown/ FLOB1991年),Crown/ CLOB2009年)等に収集されている小説データと対照させることで,時代要因を統制した上で,日本語小説と英米小説に出現するイメージ・比喩・マインドスケープの比較研究も可能になる。発表では本コーパスの開発理念と手順,また,収集済みのデータから明らかになった知見の一部を報告する。

(参考文献)
Leech, G., & Short, M. (2007) Style in Fiction (2nd Ed.).  Routledge.
日本文体論学会(編)(1991)『文体論の世界』三省堂.
中村明(2016)『日本語文体論』岩波書店.
__________________________________________________________

7/27
・2001納品。英訳2種,形態素データを作成。
・作業後,SN-04~08に★が残っていることを確認→木曜に研究室で現物確認する。

7/29
・研究室で現物からページ中央のカゲの部分を追加入力(SN-04~08)

7/31
・追加した5本について,英訳2種作り直し,形態素とりなおし,形態素台帳のデータ差し替え。




(6月)
6/2 群像1961/1991,文学界1961/1991 以上4セットの書き起こしを発注
・DeepLなどで英日相互翻訳データをつくり,4元検索を可能にするシステム設計の可能性を検討
6/14 上記4セット納品。研究室で現物と照合し,ページ境界の文字つぶれ箇所を手作業で入力追加。
・Antconcで検索し,書き起こし作業者による★(複数文字が読めない),■(1文字が読めない)の箇所を悉皆的に調査し,該当部を原文と照合して手作業で追加。

・収集作家の氏名読み,生年・没年調査(2021/6現在収録予定作家)
著者名かな
阿部 公房 あべ こうぼう 1924 1993
阿部 知二 あべ ともじ 1903 1973
池澤 夏樹 いけざわ なつき 1945 alive
石原 慎太郎 いしはら しんたろう 1932 alive
井上 光晴 いのうえ みつはる 1926 1992
上林 かんばやし あかつき 1902 1980
梅崎 春生 うめざき はるお 1915 1965
円地 文子 えんち ふみこ 1905 1986
遠藤 周作 えんどう しゅうさく 1923 1996
遠藤 周作 えんどう しゅうさく 1923 1996
大江 健三郎 おおえ けんざぶろう 1935 alive
大江 健三郎 おおえ けんざぶろう 1935 alive
大岡 昇平 おおおか しょうへい 1909 1988
大原 富枝 おおはら とみえ 1912 2000
小川 国夫 おがわ くにお 1927 2008
小川 国夫 おがわ くにお 1927 2008
杜夫 きた もりお 1927 2011
北村 鱒夫 きたむら ますお ★調査中
石範 きん せきはん 1925 alive
倉橋 由美子 くらはし 1935 2005
黒井 千次 くろい せんじ 1932 alive
小島 信夫 こじま のぶお 1915 2006
小林 恭二 こばやし きょうじ 1957 alive
米谷 ふみ子 こめたに ふみこ 1930 alive
佐藤 春夫 さとう はるお 1892 1964
澤野 久雄 さわの ひさお 1912 1992
椎名 麟三 しいな りんぞう 1911 1973
芝木 好子 しばき よしこ 1914 1991
柴田 しばた しょう 1935 alive
庄野 潤三 しょうの じゅんぞう 1921 2009
瀬戸内 寂聴 せとうち じゃくちょう 1922 alive
外村 とのむら しげる 1902 1961
曽野 綾子 その あやこ 1931 alive
田久保 英夫 たくぼ ひでお 1928 2001
武田 泰淳 たけだ たいじゅん 1912 1976
武田 繁太郎 たけだ しげたろう 1919 1986
邦夫 つじ くにお 1925 1999
邦夫 つじ くにお 1925 1999
邦夫 つじ くにお 1925 1999
津島 祐子 つしま ゆうこ 1947 2016
坪田 譲二 つぼた じょうじ 1890 1982
中上 健次 なかがみ けんじ 1946 1992
中野 幸次 なかの こうじ 1925 2004
中山 義秀 なかやま ぎしゅう 1900 1969
丹羽 文雄 にわ ふみお 1904 2005
丹羽 文雄 にわ ふみお 1904 2005
野間 のま ひろし 1915 1991
京子 はやし きょうこ 1930 2017
原田 康子 はらだ やすこ 1928 2009
日野 啓三 ひの けいぞう 1929 2002
平林 たい子 ひらばやし たいこ 1905 1972
古井 由吉 ふるい よしきち 1937 2020
マキナニー ジェイ まきなにー じぇい 1955 alive
増田 みず子 ますだ みずこ 1948 alive
増田 みず子 ますだ みずこ 1948 alive
三浦 哲郎 みうら てつお 1931 2010
宮本 徳蔵 みやもと とくぞう 1930 2011
村田 喜代子 むらた きよこ 1945 alive
室生 犀星 むろう さいせい 1889 1962
栞莉 もり まり 1903 1987
安岡 正太郎 やすおか しょうたろう 1920 2013
吉村 よしむら あきら 1927 2006
吉行 淳之介 よしゆき じゅんのすけ 1924 1994
・扱い検討 
 A 同一人物が2回,3回エントリーしている例がある
 B 米国作家の翻訳は1例含まれる

6/15
・DeepL proに登録
・全データをDeepLで英訳(目視確認の結果,同じ語がその都度違う英語に訳されていたり,同じ訳文が続けて2度表示されるなど問題もあったが,内容要約程度の目的であれば実用レベルと判断)
・英語コーパスの整形

作業メモ
(1) BROWN, FROB, FROWN, FLOBのK(小説・一般)を1シートに展開し,Left関数8文字で行コードを別セルに転記。
(2) その後,=RIGHT(A1,LEN(A1)-8)式でコードを削除したセルを作成(上記の青)
(3) その後,コーパスごとの独自記号などを調査して可能な範囲で削除
==================================
LOB  |^*   |^   ^  *'  **'   *0   **[399 TEXT K25**]  *<*4Maiden Offering*>
→削除処理
  |(1756)   
  ^(4058)    
  *系(取るとセルごと消えるのでママ)
FROWN/FLOB 各種開きタグ・閉じタグ・<#FROWN:K05\> ほか
→削除処理
  <p_> (2707) <p/> (2679)
  <quote_> (1937) <quote/> (1920)  <quote |>(約400?)
  <tf|> (173) <tf_> (79) <tf/> (77)
  <h|> (20)
  <?_> (89) <?/> (89)
==================================
(4)既知の問題 LOBの*0In thisなどが取り切れていない,各種タグ残り,途中改行ほか

6/16
・4コーパスのデータクリーニング継続
・センテンス途中の改行を削除(\n→φ)
・誤植修正タグについては修正後のみを残す
・単語の頭・途中に入りこんだ数字を除去
・そのほか[QUOTE][INDENT]<foreign>などのタグ,アクサンなどを示すコードなどを目視で確認して削除
・そのほか目視で見つかった文字化け,wonユt ('t),.モ  (文末標識?)を修正
・作業後,DeepLで邦文訳を制作

6/17
・邦文制作作業終了(29*4=116本)

6/18
・仮称 EJ-PARAFIC (English-Japanese Parallel Fiction Corpus)
・分析例
日本語作品・英語作品を区別せず,比喩「山のように」を抽出

日本語作品・英語作品を区別せず,比喩導出表現 as if~を抽出

ファイルコーディングルール(暫定)
EJ-61-UK-01  英語原作の日本語訳。1961年刊行,英国,LOBコーパスコード01番
EE-91-US-10 英語原作の英語原文。1991年刊行,米国,FROWNコーパスコード10番
JE-61-SN-01 日本語原作の英語訳。1961年刊行の新潮の作品コード01番

課題の整理
※年代別で,英語原作29×2(英・米)=58本 > 日本語原作は現状31~32本(下記)
日本側を約2倍にするにはどうするか?
 対応1) 新日本を加える?(来週,データ調査予定)
 対応2) 3雑誌からのデータ収集ポイントを各年2つにする?(1月+6月)
※対応2のほうが,データとしての性質を維持しやすい。対応2の場合,61/91に続く2021データを加えれば,90年間スパンでの観察が可能に。(英語の2021は自作が必要)
・web茶まめでタグ付けを試みるが処理不可のものや,処理してもデータがからのものが出る
・3種のうち,本日現在amazonで購入可能な雑誌(群像1月,新潮1月,文学界1月/文学界6月)をとりあえず購入(群像と新潮の6月号は次回購入)

6/19
・web茶まめのトラブル理由を整理
(a)「数字処理」オプションを入れるとこけるものがある→オプションはずす
(b) テキスト中に<のタグがあるとその前で処理が中断→< >を悉皆的に元デーデータから削除
・以上の下準備を行って,179本を順次処理(完了)
タグ付けデータの頻度解析(各列区別せずcsvで全部読みこんだ場合)

・語彙分析に使用するには,表記形列,形態素列,品詞(大区分・中区分等)別のファイルの作成が必要。
★7/9 またこける→「ファイルから解析」(※「解析してみる」でなく)

6/20
・分量について再考。英語で58本と考えず,英国29,米国29,日本31~32と考えると今のままのほうが整合性が高い(英語vs日本語なのか,英国・米国・日本と見るべきか。言語研究だけでなくマインドスケープと掲げるなら英米は区別すべきかもしれない)。その場合はここはこのままで置いておき,日本の2021作業を先行させるべきか。
・専門家に現在の英米の文芸誌の紹介を依頼。

6/21
・2021/1のデータをコピー

6/22
・上記をスキャン。整形し,発注へ。
・プロジェクトの今後の方向性の拡張についての6/22時点でのメモ
(1) 「言語から見た日米マインドスケープ比較」
  →新タイトル「言語から見た日・英・米のマインドスケープ比較」
(2) サンプリングポイント:1961/1991 only
  →新枠組み 1961/1991/2021(30年間隔3点) ※2021の英米は別途収集
  →余力あれば1961/71/81/91/01/11/21(10年間隔7点)
(3) 日本語原作と英語原作の比較
  →機械翻訳による対訳データを用いたパラレル比較

6/28
・図書館で1971年刊行雑誌を借りだし。
 文学界:コピー完了
 群像:1月号なし→文学部から取り寄せ依頼。
 新潮:1月号なし→文学部にもなし→1971年の2月号は三島由紀夫特集のため,3月号からデータ収集。(コピー完了)

6/29
・2021データの打ち込みが納品(※3本が5000字に不足,対応検討)
 21-G-03.txt(4,473字)
 21-G-07.txt(3,653字)
 21-S-11.txt(4,941字)




(5月)
5/4 データ入力作業の外注にかかる謝金の調査
5/6 2020年度の科研報告
・大学図書館で1961/1991刊行の書籍(「文学」)リストを作成
・「文学」でフィルタしても,いわゆる小説はほとんど存在しない
・文芸雑誌の所蔵状況を調査(すばるは1970年より,群像はさらに古いものも)
・文芸雑誌を母集団にする方向を検討
5/10 日本の主な文芸誌(創刊年はWikipediaによる)
 新潮(1904年創刊) 
 文學界 (1933年創刊)
 群像 (1946年創刊)
 文藝 (1933年創刊、季刊誌)
・Brown Corpusの元データの1961年以降刊行の「すばる」ははずす
・群像,文学界,新潮の3誌を中心に(神戸大に所蔵確認,国際文化)
・バラエティを増すため「オール読物」を検討したが所蔵なし。
・必要字数調査
翻訳会社time and space
日本語で400字の原稿を英語に翻訳すると、何ワードになるかといいますと、だいたい、200から210ワード
https://timeandspace.jp/blog/
★英語2,000語=日本語4,000字
翻訳会社e-jesco
日本語とヨーロッパ言語の場合、日本語400字が欧文1000文字(英語の場合、約200ワード)に相当http://www.e-jesco.jp/kakaku.html#
★英語2,000語=日本語4,000字
翻訳会社excellet
日本語で400文字の原稿を英語に翻訳すると何単語になるかといいますと、
だいたい、200から250単語になります
https://www.excellet.co.jp/blog/2017/302/
★英語2,000語=日本語4,000字
斉藤純一氏
日本語で400字の原稿を英語に翻訳すると、何語になるかといいますと、だいたい、220語から225語になります。
https://officesait.exblog.jp/1386703/
★英語2,000語=日本語3,600字
順番学研究所(各種統計調査結果をリポート)
http://jimclear.cocolog-nifty.com/blog/2011/12/16-799f.html
(国連文書の英語版と日本語版の比較から)1ワードはだいたい2.6文字に換算できる
★英文2,000語=日本語5,200字
★全体を通してみると,英語2,000語=日本語4~5,000字あたりが妥当
5/10
・大学図書館でレファレンスに大衆誌の購入方法などを相談
・新潮・文学界・群像の3雑について,書庫より1961/1991の1月号を借りだし
・うち新潮の1961/1と1991/1についてコピー&スキャン&OCR(※ページの真ん中が黒くなっており,対応を検討)
・文藝家協会に著作権処理について照会(コーパス化・公開は可能)
・Brown の小説全部とcompatibleにすると128本必要だが,SFやユーモアなどは文芸誌にはほぼない。BrownのGeneral Fictionに限れば28本。
・文芸誌1冊から約10本取れる(評論やノンフィクションは除く)。雑誌3種とすれば30冊,数のうえで28はクリアできる。

 

字数推定調査(新潮1961/1号。ページにより組が違うがおよそ1p=1500字?)
旧かなや旧漢字が多いことにいまさらながら驚く。1961ってつい最近だと思っていたが。

作品別に冒頭10p程度をコピー(するが真ん中がどうしても複写できない)

ともかくもスキャンにかける(※コップがBrown大学グッズであるのがポイント)


5/12 発注
・新潮1961/1991を外部業者(熊本,Plain社)に入力委託(ページの真ん中は飛ばす指示で。各5000字。OCRを使わず手打ちをしていただく。旧かななどは新かな変換を依頼)
5/17
・上記あがり(※会計登録不可のため,建て替えで支払い)
5/24
・新潮のページの境界の入力漏れの箇所を研究室で現物確認して補填
・群像の1961/1991をコピー
5/31
・群像の1991をスキャン
・群像1961にはコピーミスが確認されたので研究室で再度コピーのやり直し
・神戸大図書館書庫で1961/1991の両方を含む文芸雑誌の蔵書を網羅的に探し,「新日本文学」(1945~2004終刊)を見つけ,データに加える(※1961は縮刷版になっていてコピーしやすい)
・研究室で群像1961のコピー不足分,および,文学界の1961/1991をコピー





~2020年度~
(1~3月)
3/30 
・2020年度の会計執行状況の確認(※コロナ影響で支出が予定通りできなかった)
2/15
・コーパス文体論の先行研究の調査
12/20
・コーパス文体論の書籍調査


(10月)
10/5
・Brown Corpusの小説部門の構成確認 (Manual
・小説はジャンル別に収集されているが,「一般小説」などは具体的な内容が不明
・Brown のreplicationの前提として,作品情報リストを作る
・Generalセクションの作品リスト情報を入手,~01まで
10/6 
・~03まで追加
10/15 
・~15まで追加


(8~9月)
・内定にかかるオンライン手続きなど

...............................................................................................
Brown Corpus小説セクション(General Fiction)収録作品概要調査
・Amazonなどへのリンクを探す
・あらすじなどの情報を探して記載。作品のおおよその概要をつかむ。

K. General Fiction
Novels 20 Short Stories 9 Total 29/ 126(※約1/4がGeneral)

・K01 Christopher Davis First Family
[Davis] questions the ingenuousness (無邪気さ)of those who believe that white and colored children can go to school together, enter one another's homes and then be barred from one another's hearts.(米国市民権運動の時代の黒人と白人の交友。悲劇へ)
・K02 Clayton C. Barbeau The Ikon
"The Ikon" is a novel based upon the author's combat experiences in the Korean War(悲惨な朝鮮戦争での従軍経験). First published in l961 and reissued in conjunction with the unveiling of the monument to those 52,249 Americans killed, 103,284 Americans wounded, and the 8177 still missing in action in the Korean War.
・K03 Tristram Coffin Not to the Swift
詳細不明。表紙にはホワイトハウスのイラスト。副題にA Novel of the Presidency。政治ものか?
Google Booksからの情報
多く使われている語句
accused administration American Appeal Asia Atlantic atomic attack August Barnes believed bomb British called Chamberlin Chicago Tribune China claimed Cold commented commitments Committee Communism Communist Congress Congressman conservative continued critics debate December defense denied Dennis economic editorial efforts Eisenhower endorsed Europe European example feared February Flynn Follette forces Foreign Policy Germany Henry History Hoover House Human Events involved isolationism issue Italy January John Johnson July June Korea Langer leaders Libby liberal MacArthur major March Marshall McCarthy Michigan military Morley Morton Nationalist needed Neumann noted November October old isolationists opposed Papers Party Peace Pearl Harbor Plan pointed political President Presidential Press Progressive proposals Regnery remained Republican Robert Roosevelt Russia Senator September Smith soon Soviet speech stressed strong Taft Thomas Truman United University Vandenberg veteran isolationists Villard voted warned Washington Wood World York (政治もの)
・K04 W. E. B. Du Bois Worlds of Color
Du Bois(社会学者,黒人解放活動家) called his epic Black Flame trilogy (3巻本シリーズ)a fiction of interpretation. It acts as a representative biography of African American history by following one man, Manuel Mansart, from his birth in 1876 until his death.(1人の黒人の生涯を追うことで黒人の歴史を語る) ... The last book in this profound trilogy, Worlds of Color(3巻本の最終巻), opens when Mansart is sixty and a successful and established college president. ... Worlds of Color delves into a more sinister, bleak, and doubtful future(冷たく冷笑的な未来を描く).
・K05 David Stacton The Judges of the Secret Court
The Judges of the Secret Court, first published in 1961, is a historical novel about John Wilkes Booth (リンカーン暗殺者)and the aftermath of the assassination of President Abraham Lincoln in 1865. The book vividly portrays the setting and sentiments of the time, as well as Wilkes’ befuddled thinking (酩酊した思考)and his short-lived escape from justice, followed by the trial of those involved in the assassination.(伝記もの)
・K06 Louis Zara Dark Rider
詳細不詳だが,副題としてA novel based on the life of Stephen Crane。Craneは『赤い武功章』"The Red Badge of Courage"で知られる米国の早世の作家。
・K07 Francis Pollini Night
詳細不詳。Amazonの裏表紙画像より(画像出典:https://www.amazon.co.jp/Night-Francis-Pollini/dp/0450003396)

bitter and bloodyな朝鮮戦争,2名の米国兵士と1名の狂気の中国人査問者。中国に捕虜にされた米軍のひどい欠陥。GI捕虜に対する中国人の残虐さを描いた本。
・K08 Guy Endore Voltaire! Voltaire!
詳細不詳。下記Wikipediaの作家紹介ページより。
After his work as a screenwriter Endore published several other Freudian-tinged mysteries (Methinks the Lady..., Detour at Night) and also returned to his love of French history for biographical novels on Voltaire (Voltaire! Voltaire! [1961]), the Marquis de Sade (Satan's Saint [1965]) and Rousseau.(※フランスの歴史に基づくVoltaireの伝記小説)
・K09 Howard Fast April Morning
The story of one day in the life of a young American boy in colonial Lexington, the day on which he joined the militia and saw his father shot down by the British.(マサチューセッツのレキシントン(※独立戦争の戦闘地)のアメリカの少年。民兵組織に加入。父親が英軍に射殺される)(歴史もの?)
・K10 Gladys H. Barr The Master of & Geneva
Historical Novel Of The Life Of John Calvin(宗教改革で有名なカルバン派牧師のカルバン), One Of The Greatest Spiritual Leaders The World Has Known. The Book Takes Us From The Year 1521, When Calvin Was Twelve, To 1555, The Year His Protestant Authority Became Absolute.(歴史伝記)
・K11 Robert Penn Warren Wilderness
副題 A Tale Of The Civil War
In the summer of 1863, Adam Rosenzweig leaves a Bavarian ghetto and sails for the United States to fight for the North in the Civil War(南北戦争). Fired by a revolutionary idealism inherited from his father, he hopes to aid a cause that he believes to be as simple as he knows it to be just. Over the course of his journey, Adam becomes witness to a world whose complexity does not readily conform to his ideals of liberty(理想と現実のズレ). When his twisted foot attracts unwanted attention on his voyage to America, he is threatened with return to Europe. He jumps ship in New York, only to be caught up in the violence and horror of the anti-draft riots. Eventually he reaches the Union Army, serving not as a soldier but as a civilian provisioner’s assistant. Adam’s encounters with others—among them a wealthy benefactor, a former slave, an exiled Southerner, a bushwacker and his wife—further challenge the absolutism that informs his view of the world and of his place in it.(南北戦争,歴史もの)
・K12 Gerald Green The Heartless Light
A novel with a purpose, this- that purpose to expose ""the heartless light"" of publicity at any price, even the life of a child. Here is a close-up, play by play, of what happens when a kidnapping case becomes public property.(子供が誘拐された家族に向ける残忍な好奇心の目?)
・Kl3 William Maxwell The Chateau
It is 1948 and a young American couple arrive in France for a holiday, full of anticipation and enthusiasm. But the countryside and people are war-battered, and their reception at the Chateau Beaumesnil is not all the open-hearted Americans could wish for.(1948,米国の夫婦がフランス旅行。期待していたが戦争の傷跡。欧州を開放した米国からの客がなぜ歓迎されないのか?)
・K14 Irving Stone The Agony & the Ecstasy
Irving Stone's powerful and passionate biographical novel of Michelangelo(ミケランジェロの伝記). His time: the turbulent Renaissance, the years of poisoning princes, warring popes, the all-powerful Medici family, the fanatic monk Savonarola. 
・K15 Ann Hebson The Lattimer Legend
(読者レビューより by Patriot)
This is a terrific book. It takes place in the early 1960s but flashes back to the Civil War (米国南北戦争)in a nice blending of past and present. If you're at all familiar with the Parkersburg, WV area, you're in for a real treat. If not, it is still an excellent read.