Setting up Stanford Parser python interface on Mac OS X Lion and Ubuntu Linux

色々はまったので手順をメモしておく。


for Mac OS X Lion


基本的には
こちらのhereからダウンロードしたものに、stanford parserとJPypeが入っているのでそれを使用すれば良い。
(最初最新版を入れたらうまく動かなかったので 参照

JAVA_HOMEの環境変数がない場合は、事前に
export JAVA_HOME=/Library/Java/Home
export JAVA=$JAVA_HOME/bin
export PATH=$JAVA:$PATH
source .bash_profile
しておく。

MacではJPypeのセットアップの際にコンパイルエラーが出るので、ここにあるように、

In order to successfully install it, some changes need to be made to the setup.py file:

   First, make sure you have some JDK (latest, preferred) installed
   Copy the root path of the latest JDK version you want to use (for example: /Developer/SDKs/MacOSX10.6.sdk/System/Library/Frameworks/JavaVM.framework/Versions/1.6.0/)
   Edit the setup.py file, like so:

In function setupMacOSX(), set:

   self.javaHome = ‘/Developer/SDKs/MacOSX10.6.sdk/System/Library/Frameworks/JavaVM.framework/Versions/1.6.0/’

and:

   self.libraryDir = [self.javaHome+”/Libraries”]

In function setupInclusion(), set:

   self.javaHome+”/Headers”,
   self.javaHome+”/Headers/”+self.jdkInclude,

にしておく。
あとは、
stanford-parser-pythonディレクトリ以下にある、jpypeディレクトリで
rake setup
その後、stanford-parserディレクトリで
rake download
rake setup
すればOK。

for Ubuntu Linux

Macよりもシンプルです。

JAVA_HOMEの環境変数がない場合は、事前に
export JAVA_HOME=/usr/lib/jvm/java~ (環境による)さらに場合によってはjava_homeとして同じパスを追加する必要もあります。
export JAVA=$JAVA_HOME/bin
export PATH=$JAVA:$PATH
source .bash_profile
しておきます。
あとは、
stanford-parser-pythonディレクトリ以下にある、jpypeディレクトリで
rake setup
その後、stanford-parserディレクトリで
rake download
rake setup
すればOK。

stanford parserが正しくインストールされているかの確認

./lexparser.csh testsent.txt
を実行して結果が出力されればOK。
※上の手順でインストールすると、englishPCFG.ser.gzがないというエラーが出るので、最新版のgrammarディレクトリ以下にあるものを使えば良い。










タグ:

mac python linux nlp
最終更新:2011年12月19日 11:14