一、安装Hadoop2.X

1、安装JDK,Hadoop2.X要求JDK版本在1.7以上,安装完成后配置环境变量,使用java -version检查安装是否成功。

2、下载Hadoop2.X,从官网下载tar包,解压后配置环境变量,使用hadoop version检查安装是否成功。

3、配置Hadoop2.X,编辑hadoop-env.sh,设置JAVA_HOME,编辑core-site.xml,设置HDFS的NameNode节点的地址,编辑hdfs-site.xml,设置HDFS的DataNode节点的地址,编辑mapred-site.xml,设置MapReduce的JobTracker节点的地址和TaskTracker节点的地址,编辑yarn-site.xml,设置Yarn的ResourceManager节点的地址和NodeManager节点的地址。

二、启动Hadoop2.X

1、启动NameNode,使用hadoop-daemon.sh start namenode启动NameNode,使用jps检查NameNode是否启动成功。

2、启动DataNode,使用hadoop-daemon.sh start datanode启动DataNode,使用jps检查DataNode是否启动成功。

3、启动JobTracker,使用hadoop-daemon.sh start jobtracker启动JobTracker,使用jps检查JobTracker是否启动成功。

4、启动TaskTracker,使用hadoop-daemon.sh start tasktracker启动TaskTracker,使用jps检查TaskTracker是否启动成功。

三、验证Hadoop2.X

1、使用hadoop fs -ls /查看HDFS根目录,如果能够正确显示出HDFS的根目录,说明HDFS已经正确启动。

2、使用hadoop jar xxx.jar xxx.class提交一个MapReduce任务,如果能够正确执行,说明MapReduce已经正确启动。

3、使用hadoop jar xxx.jar xxx.class -Dmapred.job.tracker=xxx:9001提交一个MapReduce任务,如果能够正确执行,说明Yarn已经正确启动。