CentOS5.4上に構築する
JDK1.6をインストールしておく
# cd /etc/yum.repos.d # wget http://archive.cloudera.com/redhat/cdh/cloudera-testing.repo
# yum -y install hadoop-0.20
# yum -y install hadoop-0.20-conf-pseudo
# chkconfig --add hadoop-0.20-namenode # chkconfig --add hadoop-0.20-jobtracker # chkconfig --add hadoop-0.20-datanode # chkconfig --add hadoop-0.20-tasktracker
# service hadoop-0.20-namenode start # service hadoop-0.20-jobtracker start # service hadoop-0.20-datanode start # service hadoop-0.20-tasktracker start
http://<host>:50070/ ←HDFS http://<host>:50030/ ←MapReduce
$ vi .bash_profile PATH=/usr/lib/hadoop-0.20/bin:~ ←Hadoopのbinを追加
$ hadoop fs -mkdir TESTFOLDER01
$ cat << TEST > /tmp/test hello hadoop TEST $ hadoop fs -put /tmp/test TESTFOLDER01
$ hadoop fs -cat TESTFOLDER01/test
$ hadoop fs -get TESTFOLDER01/test /tmp/test2
$ cat /tmp/test2
http://<host>:50070/ → "Browse the filesystem"リンク → "user"リンク → "<動作確認ユーザ>"リンク → で、作成したフォルダを辿って作成したファイルへ
HDFS上のファイルの内容がブラウザから閲覧できる