このブログを検索

2022/04/28

2022.4.28 ELFコーパスVOICEワークショップに参加

Austrian Academy of ScienceとAustrian Centre for Digital Humanities and Cultural Heritageが主催する「ACDH-CH TOOL GALLERY 8.1」(Day 1プログラム)にオンラインで参加しました。 詳細



Day 1 (Thu, 28 April 2022)
14.00-14.10 Welcoming words
14.10-14.40 Spoken corpora and the challenge of long-term open access: The case of VOICE (Marie-Luise Pitzl, ACDH-CH)
14.40-15.00 Introducing VOICE: Corpus structure and text properties (Ruth Osimk-Teasdale, JKU; Stefanie Riegler, Uni Wien)
15.00-15.10 The VOICE CLARIAH project: Developing VOICE 3.0 Online (Marie-Luise Pitzl, ACDH-CH; Omar Siam, ACDH-CH)
15.10-15.30 Coffee break
15.30-16.00 Introducing VOICE 3.0 Online
16.00-17.00 Hands-on activities for using VOICE 3.0: Queries, sub-corpora, etc.
17.00-17.15 Closing discussion

VOICE3.0の新検索系の解説ビデオはこちら。検索画面の実例は下記。

XMLやPOSの検索に対応。フィラー記号などでの検索も可。

フィラーなどのタグセット

開催趣旨で主催者は下記のように言っています。

Open access (OA) is a gold standard for any language corpus. Yet, after a project’s completion, it is often challenging to keep open-access web applications ‘alive’ long-term, despite the fact that the compilation of (spoken) corpora is time- and cost-intensive. The Tool Gallery 8.1. addresses this challenge by sharing insights of the development and usability of the new web application for the Vienna-Oxford International Corpus of English (VOICE, first released in 2009), developed recently in the VOICE CLARIAH project (2020-2021). (コーパスのオープンアクセスは大事だが、プロジェクトが終了してしまうと資金も途絶え、検索サイトを以後も長く維持していくのは大変。2009完成のVOICEは新しい資金を得て新しい検索ウェブシステムを開発した。。。)


ICNALEを運用する当研究室にとってもこれは深刻な問題です。今のシステムの維持にはサーバー経費だけで年間6万円かかっています。研究費がなくなったら、退職したらどうしていけばよいのか、以前からの悩みの種ではあります。

なお、当日の講師のうち、Marie-Luise Pitzl氏は今年の英語コーパス学会で招聘予定です。オンラインではありますが彼女と簡単な挨拶を済ませておけてよかったです。