一、Sqoop安装

Sqoop是一个用于将关系数据库中的数据导入Hadoop或从Hadoop中导出到关系数据库的工具。它是一个开源的工具,目前支持Apache Hadoop和Hive 0.7.0或更高版本。Sqoop是Apache的一个子项目,基于Apache License v2.0发布。

二、Sqoop安装配置

1、首先,将sqoop-1.4.6.bin__hadoop-2.0.4-alpha.tar.gz解压到指定目录,例如/usr/local/sqoop/。

2、设置环境变量,将sqoop的bin目录添加到PATH变量中。

3、配置sqoop-env.sh,修改HADOOP_COMMON_HOME变量,指向Hadoop安装目录。

4、检查Sqoop是否安装成功,在命令行窗口输入sqoop version,如果看到Sqoop的版本信息,则说明安装成功。

三、Sqoop使用

1、建立MySQL数据库,创建表,插入测试数据。

2、使用sqoop从MySQL数据库中导入数据到Hadoop中。

3、查看Hadoop中的数据,可以看到导入的数据。