stanford coreNLP + python

Parsing からNamed Entity, POS-tagまで色々なツールが詰まったStanford CoreNLP

Python で使うにはこちらを使用します。
prerequisiteとしてpexpectが必要なので、DL&インストールしておきます。

wget http://pexpect.sourceforge.net/pexpect-2.3.tar.gz
tar xzf pexpect-2.3.tar.gz
cd pexpect-2.3
sudo python ./setup.py install

次にStanford CoreNLP本体とPython interfaceを入れます。
(version 1.2.0のみテストされているそうですが、1.3.0でも上手くいきました)

wget http://nlp.stanford.edu/software/stanford-corenlp-2012-01-08.tgz
tar xvfz stanford-corenlp-v1.2.0.tgz
cd stanford-corenlp-2012-01-08
git clone git://github.com/dasmith/stanford-corenlp-python.git
mv stanford-corenlp-python/* . 

デモ用スクリプトを動かしてみます。デフォルトのままだとversionの違いでエラーが出るので、corenlp.pyの119行目からを
jars = ["stanford-corenlp-&bold(){2012-01-08}.jar",
               "stanford-corenlp-&bold(){2011-12-27}-models.jar",
               "joda-time.jar",
               "xom.jar"]

のように、環境にあわせて修正します。
デモを見るには、
python corenlp.py
でサーバーを立ち上げて
別のセッションで、
python client.py
を動かします。
もしくは、
python corenlp.py &
python client.py
としてバックグラウンドでサーバーを起動しても良いです。

いずれにせよサーバー側のセッションはログアウトするまでportのbindが切れない?ので注意。(i.e. ctrl+z/c だけではダメ)













タグ:

python nlp
最終更新:2012年01月17日 11:25