当前位置：首页 > news >正文

hive的表操作

news 2025/7/8 12:27:48

常用的hive命令

切换数据库	use test;
查询表的建表信息	show create table 数据库名称.表名;
查看表的类型信息	desc formatted 数据库名称.表名;
删除内部表	drop table 数据库名称.表名;

先启动hdfs ，mysql ， hiveservice2，beeline

CREATE [EXTERNAL] TABLE [IF NOT EXISTS] table_name
[(col_name data_type [COMMENT COL_COMMENT],.....)]
[COMMENT table_comment]
[PARTITIONED BY (col_name data_type [COMMENT col_comment],....)]
[CLUSTERED BY (col_name,col_name,....)]
[SORTED BY (col_name [ASC|DESC],...)] INFO num_buckets BUCKETS]
[ROW FORMAT DELIMITED FIELDS TERMINATED BY ',']
[STORED AS file_format]
[LOCATION hdfs_path]

字段解释
1 CREATE TABLE创建一个指定名字的表，如果名字相同抛出异常，用户可以使用IF NOT EXISTS来忽略异
常

2 EXTERNAL关键字可以创建一个外部表，在建表的同时指定一个实际数据的路径（LOCATION）
,hive在删除表的时候，内部表的元数据和数据会被一起删除，而外部表只删除元数据，不删除数据

3 COMMENT是为表和列添加注释

4 PARTITIONED BY是分区表

5 CLUSTERED BY 是建分桶(不常用)

6 SORTED BY 是指定字段进行排序(不常用)

7 ROW FORMAT DELIMITED FIELDS TERMINATED BY ',' 是指每行数据中列分隔符为","
默认分隔符为" \001"

8 STORED AS 指定存储文件类型,数据文件是纯文本,可以使用STORED AS TEXTFILE

9 LOCATION 指定表在HDFS上的存储位置,内部表不要指定,
但是如果定义的是外部表，则需要直接指定一个路径。

--创建数据库test

create database if not exists test;

--在数据库test中创建emp1表
--有两种方式

--1.先切换数据库再创建表

use test;create table if not exists emp1(emp_id int,emp_name string,department_id int)
stored as textfile
;

--将以上内容写入sql文件中，再用source 执行文件

source /opt/sql/create_emp.sql;

--查询表的建表信息
--show create table 数据库名称.表名;

show create table test.emp1;

+----------------------------------------------------+
|                   createtab_stmt                   |
+----------------------------------------------------+
| CREATE TABLE `test.emp1`(                          |
|   `emp_id` int,                                    |
|   `emp_name` string,                               |
|   `department_id` int)                             |
| ROW FORMAT SERDE                                   |
|   'org.apache.hadoop.hive.serde2.lazy.LazySimpleSerDe'  |
| STORED AS INPUTFORMAT                              |
|   'org.apache.hadoop.mapred.TextInputFormat'       |
| OUTPUTFORMAT                                       |
|   'org.apache.hadoop.hive.ql.io.HiveIgnoreKeyTextOutputFormat' |
| LOCATION                                           |
|   'hdfs://bigdata004:8020/user/hive/warehouse/test.db/emp1' |
| TBLPROPERTIES (                                    |
|   'bucketing_version'='2',                         |
|   'transient_lastDdlTime'='1719865642')            |
+----------------------------------------------------+

--2.直接在建表语句中指定对应的数据库

create table if not exists test.emp1(emp_id int,emp_name string,department_id int)
stored as textfile
;

--查看表的类型信息
--desc formatted 数据库名称.表名;
desc formatted test.emp1;


+-------------------------------+----------------------------------------------------+----------------------------------------------------+
|           col_name            |                     data_type                      |                      comment                       |
+-------------------------------+----------------------------------------------------+----------------------------------------------------+
| # col_name                    | data_type                                          | comment                                            |
| emp_id                        | int                                                |                                                    |
| emp_name                      | string                                             |                                                    |
| department_id                 | int                                                |                                                    |
|                               | NULL                                               | NULL                                               |
| # Detailed Table Information  | NULL                                               | NULL                                               |
| Database:                     | test                                               | NULL                                               |
| OwnerType:                    | USER                                               | NULL                                               |
| Owner:                        | root                                               | NULL                                               |
| CreateTime:                   | Tue Jul 02 04:27:22 CST 2024                       | NULL                                               |
| LastAccessTime:               | UNKNOWN                                            | NULL                                               |
| Retention:                    | 0                                                  | NULL                                               |
| Location:                     | hdfs://bigdata004:8020/user/hive/warehouse/test.db/emp1 | NULL                                               |
| Table Type:                   | MANAGED_TABLE                                      | NULL                                               |
| Table Parameters:             | NULL                                               | NULL                                               |
|                               | COLUMN_STATS_ACCURATE                              | {\"BASIC_STATS\":\"true\",\"COLUMN_STATS\":{\"department_id\":\"true\",\"emp_id\":\"true\",\"emp_name\":\"true\"}} |
|                               | bucketing_version                                  | 2                                                  |
|                               | numFiles                                           | 0                                                  |
|                               | numRows                                            | 0                                                  |
|                               | rawDataSize                                        | 0                                                  |
|                               | totalSize                                          | 0                                                  |
|                               | transient_lastDdlTime                              | 1719865642                                         |
|                               | NULL                                               | NULL                                               |
| # Storage Information         | NULL                                               | NULL                                               |
| SerDe Library:                | org.apache.hadoop.hive.serde2.lazy.LazySimpleSerDe | NULL                                               |
| InputFormat:                  | org.apache.hadoop.mapred.TextInputFormat           | NULL                                               |
| OutputFormat:                 | org.apache.hadoop.hive.ql.io.HiveIgnoreKeyTextOutputFormat | NULL                                               |
| Compressed:                   | No                                                 | NULL                                               |
| Num Buckets:                  | -1                                                 | NULL                                               |
| Bucket Columns:               | []                                                 | NULL                                               |
| Sort Columns:                 | []                                                 | NULL                                               |
| Storage Desc Params:          | NULL                                               | NULL                                               |
|                               | serialization.format                               | 1                                                  |
+-------------------------------+----------------------------------------------------+----------------------------------------------------+
33 rows selected (0.153 seconds)

--创建带有注释的内部表emp2

create table if not exists test.emp2(emp_id int comment "员工id",emp_name string comment "员工姓名",department_id int comment "部门id"
)
comment "员工内部表"
stored as textfile
;

--将以上内容写入sql文件中，再用source
--在beeline命令行中执行sql文件

此时查看建表信息


+----------------------------------------------------+
|                   createtab_stmt                   |
+----------------------------------------------------+
| CREATE TABLE `test.emp2`(                          |
|   `emp_id` int COMMENT '??id',                     |
|   `emp_name` string COMMENT '????',                |
|   `department_id` int COMMENT '??id')              |
| COMMENT '?????'                                    |
| ROW FORMAT SERDE                                   |
|   'org.apache.hadoop.hive.serde2.lazy.LazySimpleSerDe'  |
| STORED AS INPUTFORMAT                              |
|   'org.apache.hadoop.mapred.TextInputFormat'       |
| OUTPUTFORMAT                                       |
|   'org.apache.hadoop.hive.ql.io.HiveIgnoreKeyTextOutputFormat' |
| LOCATION                                           |
|   'hdfs://bigdata004:8020/user/hive/warehouse/test.db/emp2' |
| TBLPROPERTIES (                                    |
|   'bucketing_version'='2',                         |
|   'transient_lastDdlTime'='1719868467')            |
+----------------------------------------------------+
16 rows selected (0.104 seconds)

问号部分就是注释里的中文，要解决下其乱码问题

解决hive中文乱码

1.登录mysql 执行如下命令然后重启mysql

得先退出hive 并杀死进程 kill -9 进程号

#修改字段注释字符集
alter table hive.COLUMNS_V2 modify column COMMENT varchar(256) character set utf8;#修改表注释字符集
alter table hive.TABLE_PARAMS modify column PARAM_VALUE varchar(20000) character set utf8;#修改分区参数，支持分区建用中文表示
alter table hive.PARTITION_PARAMS modify column PARAM_VALUE varchar(20000) character set utf8;
alter table hive.PARTITION_KEYS modify column PKEY_COMMENT varchar(20000) character set utf8;

打开navicat

将命令输入，点击运行

重启mysql

systemctl stop mysqld
systemctl start mysqld

##2. 在hive-site.xml配置文件中修改如下配置

      <property><name>javax.jdo.option.ConnectionURL</name><value>jdbc:mysql://bigdata004:3306/hive?createDatabaseIfNotExist=true&amp;useSSL=false&amp;useUnicode=true&amp;characterEncoding=UTF-8</value><description>JDBC connect string for a JDBC metastore</description></property>

对于之前创建的带注释的表emp2不起效果，一=应该重新创建一个注释的表


+----------------------------------------------------+
|                   createtab_stmt                   |
+----------------------------------------------------+
| CREATE TABLE `test.emp2`(                          |
|   `emp_id` int COMMENT '员工id',                     |
|   `emp_name` string COMMENT '员工姓名',                |
|   `department_id` int COMMENT '部门id')              |
| COMMENT '?????'                                    |
| ROW FORMAT SERDE                                   |
|   'org.apache.hadoop.hive.serde2.lazy.LazySimpleSerDe'  |
| STORED AS INPUTFORMAT                              |
|   'org.apache.hadoop.mapred.TextInputFormat'       |
| OUTPUTFORMAT                                       |
|   'org.apache.hadoop.hive.ql.io.HiveIgnoreKeyTextOutputFormat' |
| LOCATION                                           |
|   'hdfs://bigdata004:8020/user/hive/warehouse/test.db/emp2' |
| TBLPROPERTIES (                                    |
|   'bucketing_version'='2',                         |
|   'transient_lastDdlTime'='1719869823')            |
+----------------------------------------------------+

成功了

hive的表操作

常用的hive命令切换数据库use test;查询表的建表信息show create table 数据库名称.表名;查看表的类型信息desc formatted 数据库名称.表名; 删除内部表 drop table 数据库名称.表名; 先启动hdfs ，mysql ， hiveservice2，beeline CREATE [EX…...

编程日记 2024/7/3 10:07:38

基于多视点编码光场的全景三维重建方法

欢迎关注GZH《光场视觉》摘要：在基于光场的一系列应用中，目标的三维重建是基础且关键的任务。普通光场只能重建单一视角而无法重建全景，并且在纹理特征匮乏的区域也无法生成准确的三维信息。针对以上问题，提出一种基于多视点编码…...

编程日记 2024/7/3 10:06:37

Spring Boot中的分布式文件系统

Spring Boot中的分布式文件系统大家好，我是免费搭建查券返利机器人省钱赚佣金就用微赚淘客系统3.0的小编，也是冬天不穿秋裤，天冷也要风度的程序猿！今天，我们将探讨如何在Spring Boot中实现分布式文件系统的搭建和应用…...

编程日记 2024/7/3 10:05:35

three.js地理坐标系有哪些，和屏幕坐标系的转换。

坐标系很好理解，就是点线面体的位置，一个点是一个坐标，一条线段2个坐标，一个矩形四个坐标，一个立方体8个坐标，three.js面对的是三维空间，屏幕则是二维的，这就面临着转换问题&#xf…...

编程日记 2024/7/3 10:04:34

聊聊C++20的三向比较运算符 `＜=＞`

C20标准引入了许多新特性，其中之一是三向比较运算符 <>，也被称为太空船运算符。这个新运算符为C程序员提供了一种全新的比较对象的方式，它能有效简化比较逻辑，避免编写多个比较运算符重载的情况。为什么需要三向比较运算符…...

编程日记 2024/7/3 10:03:33

CVE-2024-0603 漏洞复现

CVE-2024-0603 源码：https://gitee.com/dazensun/zhicms 开题： CVE-2024-0603描述：ZhiCms up to 4.0版本的文件app/plug/controller/giftcontroller.php中存在一处未知漏洞。攻击者可以通过篡改参数mylike触发反序列化，从而远程…...

编程日记 2024/7/3 10:02:32

西部智慧健身小程序+华为运动健康服务

1、应用介绍西部智慧健身小程序为用户提供一站式全流程科学健身综合服务。用户通过登录微信小程序，可享用健康筛查、运动风险评估、体质检测评估、运动处方推送、个人运动数据监控与评估等公益服务。 2、体验介绍西部智慧健身小程序华为运动健康服务核心体验如…...

编程日记 2024/7/3 9:59:29

Spring Boot中如何处理异步任务

Spring Boot中如何处理异步任务大家好，我是免费搭建查券返利机器人省钱赚佣金就用微赚淘客系统3.0的小编，也是冬天不穿秋裤，天冷也要风度的程序猿！今天我们将探讨在Spring Boot应用中如何处理异步任务，以提升系统的性…...

编程日记 2024/7/3 9:56:25

数字化精益生产系统--RD研发管理系统

R&D研发管理系统是一种用于管理和监督科学研究和技术开发的软件系统，其设计和应用旨在提高企业研发活动的效率、质量和速度。以下是对R&D研发管理系统的功能设计：...

编程日记 2024/7/3 9:55:24

目录枕形畸变和去枕形畸变去枕形畸变失败枕形畸变和去枕形畸变 import cv2 import numpy as np import matplotlib.pyplot as plt# 创建一个带网格的原始图像 def create_grid(image_size512, grid_size20):image np.zeros((image_size, image_size, 3), dtypenp.uint8)…...

编程日记 2024/7/3 9:54:22

DC/AC电源模块：为智能家居设备提供恒定的电力供应

BOSHIDA DC/AC电源模块：为智能家居设备提供恒定的电力供应 DC/AC电源模块是一种常见的电源转换器，它将直流电源（DC）转换为交流电源（AC），为智能家居设备提供恒定的电力供应。在智能家居系统中&a…...

编程日记 2024/7/3 9:53:21

小红书运营教程02

小红书大致会分享10篇左右。微博、抖音、以及视频剪辑等自媒体运营相关技能以及运营教程相关会陆续的进行分享。上次分享涉及到的对比，母婴系列，或者可以说是服装类型，不需要自己过多的投入，对比知识类博主来说，自己将知识讲述出来，然后要以此账号进行变现就比较麻烦，…...

编程日记 2024/7/3 9:52:19

k8s自动清理节点服务

要在 Kubernetes 中实现当某个节点的 CPU 或内存使用超过 90% 时清理该节点上的服务，你可以使用以下几种方法： 自定义脚本和 cron job：编写一个脚本监控节点的资源使用情况，并在超过阈值时触发清理操作。使用 DaemonSet 运行监控…...

编程日记 2024/7/3 9:51:17

JS如何把年月日转为时间戳

在JavaScript中，将年月日（通常表示为一个字符串或者分别的年、月、日数字）转换为时间戳（即Unix时间戳，是自1970年1月1日（UTC/GMT的午夜）开始所经过的秒数，不考虑闰秒）可以…...

编程日记 2024/7/3 9:50:16

【YOLOv5进阶】——引入注意力机制-以SE为例

声明：笔记是做项目时根据B站博主视频学习时自己编写，请勿随意转载！ 一、站在巨人的肩膀上 SE模块即Squeeze-and-Excitation 模块，这是一种常用于卷积神经网络中的注意力机制！！ 借鉴代码的代码链接如下&a…...

编程日记 2024/7/3 9:49:15

【C++题解】1456. 淘淘捡西瓜

问题：1456. 淘淘捡西瓜类型：贪心题目描述： 地上有一排西瓜，每个西瓜都有自己的重量。淘淘有一个包，包的容量是固定的，淘淘希望尽可能在包里装更多的西瓜（当然要装整个的，不能切开…...

编程日记 2024/7/3 9:48:14

用Python读取Word文件并提取标题

前言在日常工作中，我们经常需要处理Word文档，特别是从中提取关键信息，如标题、段落等。今天，我们将利用Python来实现这一功能，并为大家提供一段完整的代码示例。准备工作首先，你需要安装python-docx库…...

编程日记 2024/7/3 9:45:11

Windows编程上

Windows编程[上] 一、Windows API1.控制台大小设置1.1 GetStdHandle1.2 SetConsoleWindowInfo1.3 SetConsoleScreenBufferSize1.4 SetConsoleTitle1.5 封装为Innks 2.控制台字体设置以及光标调整2.1 GetConsoleCursorInfo2.2 SetConsoleCursorPosition2.3 GetCurrentConsoleFon…...

编程日记 2024/7/3 9:44:09

BiTCN-Attention一键实现回归预测+8张图+特征可视化图！注意力全家桶再更新！

声明：文章是从本人公众号中复制而来，因此，想最新最快了解各类智能优化算法及其改进的朋友，可关注我的公众号：强盛机器学习，不定期会有很多免费代码分享~ 目录原理简介数据介绍结果展示全家桶代码目…...

编程日记 2024/7/3 9:43:07

zoom缩放问题(关于ElementPlus、Echarts、Vue3draggable等组件偏移问题)

做了一个项目下来，由于整体界面偏大，采取了缩放90%，导致很多组件出现偏移问题，以下我会把我遇到的各种组件偏移问题依次进行描述解答： ElementPlus选择器下拉偏移 <template><el-select :teleported"f…...

编程日记 2024/7/3 9:41:05

web vue 项目 Docker化部署

Web 项目 Docker 化部署详细教程目录 Web 项目 Docker 化部署概述Dockerfile 详解构建阶段生产阶段构建和运行 Docker 镜像 1. Web 项目 Docker 化部署概述 Docker 化部署的主要步骤分为以下几个阶段： 构建阶段（Build Stage）&#xff1a…...

编程新知 2025/7/6 4:04:07