一、Hadoop 安装

1、下载 Hadoop 安装包,在官网上可以下载到最新的 Hadoop 安装包,下载完成之后,将安装包解压到指定的目录。

2、编辑 Hadoop 配置文件,Hadoop 的配置文件位于 Hadoop 安装目录的 etc/hadoop 目录下,需要编辑的文件有 core-site.xml、hdfs-site.xml、mapred-site.xml、yarn-site.xml 等,这些文件中包含了 Hadoop 的各种配置参数,需要根据实际情况进行编辑。

3、配置环境变量,需要将 Hadoop 的 bin 目录加入到系统的环境变量中,以便在任何目录下都可以使用 Hadoop 命令。

4、启动 Hadoop,使用 start-all.sh 脚本可以启动 Hadoop,也可以使用 stop-all.sh 脚本停止 Hadoop。

二、Hadoop 配置

1、配置 HDFS,HDFS 是 Hadoop 的分布式文件系统,需要在 hdfs-site.xml 文件中配置文件系统的块大小、副本数量、安全模式等参数。

2、配置 YARN,YARN 是 Hadoop 的资源管理系统,需要在 yarn-site.xml 文件中配置资源管理器的内存限制、节点管理器的内存限制等参数。

3、配置 MapReduce,MapReduce 是 Hadoop 的分布式计算框架,需要在 mapred-site.xml 文件中配置任务调度器的内存限制、任务调度器的线程池大小等参数。

三、Hadoop 测试

1、使用 hadoop fs -ls 命令可以查看 HDFS 上的文件,使用 hadoop fs -mkdir 命令可以在 HDFS 上创建目录。

2、使用 hadoop jar 命令可以运行 MapReduce 程序,使用 hadoop job -list 命令可以查看正在运行的 MapReduce 作业。

3、使用 hadoop dfsadmin -report 命令可以查看集群的状态,使用 yarn node -list 命令可以查看集群中的节点信息。