一、安装 Hadoop

1、准备安装环境,安装 JDK,Hadoop 需要 Java 环境,所以需要安装 JDK,如果已经安装,可以跳过此步骤。

2、下载 Hadoop,从官网下载 Hadoop 安装包,并解压到指定的安装目录。

3、配置 Hadoop,配置 Hadoop 需要修改 Hadoop 安装目录下的配置文件,包括 hadoop-env.sh、core-site.xml、hdfs-site.xml、mapred-site.xml、yarn-site.xml 等,配置文件中的参数需要根据实际情况进行修改,比如机器的主机名,磁盘的路径等。

4、启动 Hadoop,在 Hadoop 安装目录下,执行 start-all.sh 脚本,即可启动 Hadoop 集群。

二、配置 Hadoop 环境变量

1、编辑环境变量,打开系统环境变量文件,添加 Hadoop 的环境变量,比如 HADOOP_HOME,HADOOP_CLASSPATH 等。

2、配置 Path 变量,在 Path 变量中添加 Hadoop bin 目录,以及 Hadoop 的 lib 目录,以便在任何目录下都可以执行 Hadoop 的命令。

export HADOOP_HOME=/usr/local/hadoopexport HADOOP_CLASSPATH=$HADOOP_HOME/libexport PATH=$PATH:$HADOOP_HOME/bin
Bash

三、测试 Hadoop

1、启动 HDFS,执行 start-dfs.sh 脚本,启动 Hadoop 文件系统,此时 Hadoop 集群中会有 NameNode 和 DataNode 节点。

2、创建目录,使用 hadoop fs -mkdir 命令创建 HDFS 上的文件目录,用来存放文件。

$ hadoop fs -mkdir /user/hadoop
Bash

3、上传文件,使用 hadoop fs -put 命令将本地文件上传到 HDFS 上,以便在 Hadoop 集群中使用。

$ hadoop fs -put /tmp/test.txt /user/hadoop
Bash

4、查看文件,使用 hadoop fs -ls 命令查看文件是否上传成功,如果能够看到文件,说明 Hadoop 安装配置成功。

$ hadoop fs -ls /user/hadoop
Bash