Hive基础操作

Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供简单的sql查询功能,可以将sql语句转换为MapReduce任务进行运行。

1. 创建数据库

Hive中可以创建多个数据库,使用create database语句可以创建一个数据库,如:

2. 创建表

Hive中的表分为内部表和外部表,内部表的数据存储在Hive的文件系统中,外部表的数据存储在Hadoop的文件系统中,使用create table语句可以创建表,如:

3. 插入数据

使用load data语句可以将本地数据文件加载到Hive表中,如:

4. 查询数据

使用select语句可以查询表中的数据,如:

5. 导出数据

使用insert overwrite语句可以将表中的数据导出到本地文件,如: