科研で作っていた表記システムがリリースされました。
このツールは
(1)英語テキスト&日本語テキストに対応
(2)オンラインで稼働するのでOSを問わない
(3)どのファイルにどの語が何回出ているかを一覧表示する「統合語彙頻度表」を作成できる
(4)表層形、表層形+品詞、語彙素、語彙素+品詞の4モードの出力に対応
といった特徴を持ちます。
単語ごとにレンジ(出現するファイル数)を比較したり、多変量解析のベースデータを作ったりする際に便利ではないかと存じます。開発版のため、お気づきの点があれば、ご教示いただけますと幸いです。