横井?

※ここからが教員側(masterのみ)-----------------------------------------------------------

ssh-keyの作成

ssh-keygen -t rsa -P '' -f ~/.ssh/id_rsa

ssh-keyの配布

ssh-copy-id -i ~/.ssh/id_rsa.pub -o "StrictHostKeyChecking no" mater
sshpass -p "tpu" ssh-copy-id -i ~/.ssh/id_rsa.pub -o "StrictHostKeyChecking no" master
sshpass -p "tpu" ssh-copy-id -i ~/.ssh/id_rsa.pub -o "StrictHostKeyChecking no" slave1

※slaveの台数分実行

※master自身と、各slaveにパスワードなしでsshできることを確認する  初回実行時は[y]入力が必要になる

ssh master
ssh slave1

※slaves の編集

vim $HADOOP_HOME/etc/hadoop/slaves
slave1
slave2

※etc/hadoop/core-site.xmlの書き換え

 <property>
   <name>fs.defaultFS</name>
   <value>hdfs://192.168.2.200:9000</value>
 </property>

※etc/hadoop/hdfs-site.xmlの書き換え

 <property>
   <name>dfs.replication</name>
   <value>2</value>
 </property>
 <property>
   <name>dfs.namenode.secondary.http-address</name>
   <value>192.168.2.200:50090</value>
 </property>
  <property>
     <name>dfs.data.dir</name>
     <value>/home/tpu/hadoop-2.8.5/data</value>
  </property>
  <property>
     <name>dfs.name.dir</name>
     <value>/home/tpu/hadoop-2.8.5/name</value>
  </property>
  <property>
     <name>dfs.namenode.datanode.registration.ip-hostname-check</name>
     <value>false</value>
  </property>

その後

cp etc/hadoop/mapred-site.xml.template etc/hadoop/mapred-site.xml

のちetc/hadoop/mapred-site.xmlの書き換え

 <property>
   <name>mapreduce.framework.name</name>
   <value>yarn</value>
 </property>

※etc/hadoop/yarn-site.xmlの書き換え

 <property>
   <name>yarn.nodemanager.aux-services</name>
   <value>mapreduce_shuffle</value>
 </property>
 <property>
   <name>yarn.resourcemanager.hostname</name>
   <value>192.168.2.200</value>
 </property>

設定ファイルを全スレーブにばら撒く(準備ができたスレーブから)

scp $HADOOP_HOME/etc/hadoop/* slave1:$HADOOP_HOME/etc/hadoop/
scp $HADOOP_HOME/etc/hadoop/* slave2:$HADOOP_HOME/etc/hadoop/

※nameディレクトリを作成

mkdir $HADOOP_HOME/name

※dataディレクトリを作成

mkdir $HADOOP_HOME/data

※HDFSをフォーマット

hdfs namenode -format

※HDFSのデーモンを起動

$HADOOP_HOME/sbin/start-dfs.sh

※YARN関連のデーモン起動

$HADOOP_HOME/sbin/start-yarn.sh

※起動の確認

jps

※masterでは

2625 NameNode
2946 Jps
2823 SecondaryNameNode
3005 ResourceManager

※slaveでは

4560 NodeManager
5090 Jps
4456 DataNode

ジョブ履歴を管理するサービス起動(不要?)

mr-jobhistory-daemon.sh --config $HADOOP_CONF_DIR start historyserver

※(masterのみ)-----------------------------------------------------


トップ   新規 一覧 検索 最終更新   ヘルプ   最終更新のRSS