E-KWICのみをダウンロードされる方はこちら

「E-KWICのみをダウンロードされる方はこちら」の編集履歴(バックアップ)一覧に戻る

E-KWICのみをダウンロードされる方はこちら - (2008/03/20 (木) 06:33:26) の編集履歴(バックアップ)


E-KWIC

  • E-KWICの仕様に合わせてデータを加工すれば、個人保有のデータに対しても形態素解析済みデータを検索することができます。
  • 以下の手順に従って、操作してください。
  1. こちらからE-KWICをダウンロードする
  2. dataフォルダ内に形態素解析済みデータを入れる
    1. 「Chasen」で形態素解析したデータを入れてください。
    2. ファイル名はKYコーパスの規定に従ってください。KYコーパスでは「ENM02」といったような、「3つのローマ字+2桁の数字」という番号がついていますが、その1つめのローマ字は、その被験者の母語を表しています。中国語ならC、英語ならE、韓国語ならKです。そして、2つめのローマ字は、OPIにおける言語能力の判定結果を表しています。初級(Novice)ならN、中級(Intermediate)ならI、上級(Advanced)ならA、超級(Superior)ならS です。3つめのローマ字はサブレベルを表しており、「-下(low)」ならL、「-中(mid)」ならM、「-上(high)」ならHです。ただし、超級にはサブレベルはありません。また、上級も、ただの「上級」と「上級-上」の2つに分かれているのみです。ですから、「超級」と、ただの「上級」の場合には、「3つのローマ字+2桁の数字」ではなく、「2つのローマ字+2桁の数字」になっています。最後の「2桁の数字」は、同じ母語で同じレベルのものの中での通し番号です。