1. 创建数据库

Hive中使用CREATE DATABASE语句来创建数据库,语法如下:


其中,IF NOT EXISTS可以防止多次创建同名数据库,COMMENT用于添加数据库描述,LOCATION用于指定数据库存储位置,WITH DBPROPERTIES用于添加属性。

2. 创建表

Hive中使用CREATE TABLE语句来创建表,语法如下:


其中,EXTERNAL表示创建外部表,IF NOT EXISTS可以防止多次创建同名表,COMMENT用于添加表描述,PARTITIONED BY用于添加分区字段,CLUSTERED BY用于指定聚簇字段,SORTED BY用于指定排序字段,INTO num_buckets BUCKETS用于指定聚簇桶的数量,ROW FORMAT用于指定行格式,STORED AS用于指定存储格式,LOCATION用于指定表存储位置,TBLPROPERTIES用于添加属性,AS select_statement用于指定查询语句。

3. 插入数据

Hive中使用LOAD DATA语句来插入数据,语法如下:


其中,LOCAL表示本地文件,OVERWRITE表示覆盖已有数据,INTO TABLE表示要插入的表,PARTITION用于指定分区字段。

4. 查询数据

Hive中使用SELECT语句来查询数据,语法如下:


其中,ALL表示查询所有字段,DISTINCT表示查询不重复字段,FROM表示要查询的表,WHERE表示查询条件,GROUP BY表示分组字段,CLUSTER BY表示聚簇字段,DISTRIBUTE BY表示分布字段,SORT BY表示排序字段,LIMIT表示查询条数。