「Webから自動構築した大規模格フレーム」の使用レポート
- ウェブ上の約5億文の日本語テキストから自動的に構築した格フレームを検索できるサービス。
基本的な使用の手順
- http://reed.kuee.kyoto-u.ac.jp/cf-search/ にアクセス
- 調べたい語を入力し「検索」をクリック
どんな検索ができるか
- 基本的な検索:任意の用言を入力することで,その用言を主要部とするような格フレームの一覧を表示することができる。それぞれの格フレームには,格要素として現れる単語のリストが表示される(頻度2以上,上位20位まで)。
- 格要素との組み合わせでの検索:「裏目に出る」のように格要素と用言を組み合わせて(スペースを空けて)入力することで,特定の格要素を含む格フレームを検索できる。
- 受身・使役形での検索:検索語のあとに「:P」をつけることで受身形の検索,「:C」をつけることで使役形の検索ができる。
- 名詞からの検索:「名詞から検索」チェックボックスをオンにすることで名詞から検索できる。その名詞が頻度2以上現れる格フレームの一覧が表示される。リンクをクリックすることで,その格フレームの詳細を表示することができる。
- 原文の検索: 格フレームの検索結果で格要素をクリックすると原文の一覧を表示することができる。
問題点
- 自動的に抽出された格フレームの精度が必ずしも良くないため,しばしばデータの解釈が難しい。また,単一の用言に対する格フレームの数が多すぎて把握しにくい。
- 現在ウェブを通じてのみの提供のため,目的に応じた柔軟な検索や,出力結果の加工がしにくい。
- ウェブ上のテキストから自動構築したため,用例にウェブ特有の俗語が目立つ。また公序良俗に反すると思われるサイトからの用例も排除できていない。
最終更新:2009年05月09日 23:33