当前位置：首页 > news >正文

Hive 安装介绍

news 2026/6/1 2:14:13

介绍

Hive是基于Hadoop的一个数据仓库工具，可以将结构化的数据文件映射为一张数据库表，并提供类SQL查询功能。

其本质是将SQL转换为MapReduce的任务进行运算，底层由HDFS来提供数据的存储，说白了hive可以理解为一个将SQL转换为MapReduce的任务的工具，甚至更进一步可以说hive就是一个MapReduce的客户端。

官网

###  官网
https://hive.apache.org/## 中文参考
https://www.docs4dev.com/docs/zh/apache-hive/3.1.1/reference/LanguageManual_DML.html

Hive的安装模式

内嵌模式： 内嵌式是内嵌在derby数据库俩存储元数据，也不需要额外起Metastore服务。数据库和Metastore服务都嵌入在主Hive Server进程中。这个是默认的，配置简单，但是一次只能一个客户端连接，比较适合实验，不能用于生产环境。

本地模式： 本地模式采用外部数据库来存储元数据，目前支持的数据库有：mysql、postgre。本地模式不需要单独起metastore服务，用的是跟hive在同一个进程里的metastore服务。也就是说当你启动一个hive服务，里面默认会帮我们启动一个metastore服务。

远程模式： 远程模式下，需要单独起metastore服务，然后每个客户端都在配置文件里配置连接到该metastore服务。远程模式的metastore服务和hive运行在不同的进程中。在生产环境中，建议用远程模式来配置Hive metastore。在这种情况下，其他依赖hive的软件都可以通过访问metastore 访问hive

安装

## 
cd /opt/software
tar -zxvf apache-hive-3.1.1-bin.tar.gz -C /opt/module/## 
vi /etc/profile## 
export HIVE_HOME=/opt/module/apache-hive-3.1.1-bin
export PATH=$PATH:$HADOOP_HOME/sbin:$HIVE_HOME/bin## 
source /etc/profile## 修改hive的环境变量
cd  /opt/module/apache-hive-3.1.1-bin/bin/ && vi hive-config.shexport JAVA_HOME=/opt/module/jdk1.8.0_11
export HIVE_HOME=/opt/module/apache-hive-3.1.1-bin
export HADOOP_HOME=/opt/module/hadoop-3.2.0
export HIVE_CONF_DIR=/opt/module/apache-hive-3.1.1-bin/conf## 拷贝hive的配置文件
cd /opt/module/apache-hive-3.1.1-bin/conf/
cp hive-default.xml.template hive-site.xml

修改Hive配置文件,找到对应的位置进行修改: 主要是修改连接Mysql

 <property><name>javax.jdo.option.ConnectionDriverName</name><value>com.mysql.cj.jdbc.Driver</value><description>Driver class name for a JDBC metastore</description></property>
<property><name>javax.jdo.option.ConnectionUserName</name><value>root</value><description>Username to use against metastore database</description></property>
<property><name>javax.jdo.option.ConnectionPassword</name><value>root123</value><description>password to use against metastore database</description></property>
<property><name>javax.jdo.option.ConnectionURL</name>
<value>jdbc:mysql://192.168.202.131:3306/hive?useUnicode=true&amp;characterEncoding=utf8&amp;useSSL=false&amp;serverTimezone=GMT</value><description>JDBC connect string for a JDBC metastore.To use SSL to encrypt/authenticate the connection, provide database-specific SSL flag in the connection URL.For example, jdbc:postgresql://myhost/db?ssl=true for postgres database.</description></property><property><name>datanucleus.schema.autoCreateAll</name><value>true</value><description>Auto creates necessary schema on a startup if one doesn't exist. Set this to false, after creating it once.To enable auto create also set hive.metastore.schema.verification=false. Auto creation is not recommended for production use cases, run schematool command instead.</description></property>
<property><name>hive.metastore.schema.verification</name><value>false</value><description>Enforce metastore schema version consistency.True: Verify that version information stored in is compatible with one from Hive jars.  Also disable automaticschema migration attempt. Users are required to manually migrate schema after Hive upgrade which ensuresproper metastore schema migration. (Default)False: Warn if the version information stored in metastore doesn't match with one from in Hive jars.</description></property>
<property><name>hive.exec.local.scratchdir</name><value>/opt/module/apache-hive-3.1.1-bin/tmp/${user.name}</value><description>Local scratch space for Hive jobs</description></property><property>
<name>system:java.io.tmpdir</name>
<value>/opt/module/apache-hive-3.1.1-bin/iotmp</value>
<description/>
</property><property><name>hive.downloaded.resources.dir</name>
<value>/opt/module/apache-hive-3.1.1-bin/tmp/${hive.session.id}_resources</value><description>Temporary local directory for added resources in the remote file system.</description></property>
<property><name>hive.querylog.location</name><value>/opt/module/apache-hive-3.1.1-bin/tmp/${system:user.name}</value><description>Location of Hive run time structured log file</description></property><property><name>hive.server2.logging.operation.log.location</name>
<value>/opt/module/apache-hive-3.1.1-bin/tmp/${system:user.name}/operation_logs</value><description>Top level directory where operation logs are stored if logging functionality is enabled</description></property><property><name>hive.metastore.db.type</name><value>mysql</value><description>Expects one of [derby, oracle, mysql, mssql, postgres].Type of database used by the metastore. Information schema &amp; JDBCStorageHandler depend on it.</description></property><property><name>hive.cli.print.current.db</name><value>true</value><description>Whether to include the current database in the Hive prompt.</description></property><property><name>hive.cli.print.header</name><value>true</value><description>Whether to print the names of the columns in query output.</description></property><property><name>hive.metastore.warehouse.dir</name><value>/user/hive/warehouse</value><description>location of default database for the warehouse</description></property>

上传mysql驱动包到/usr/local/soft/apache-hive-3.1.1-bin/lib/文件夹下，驱动包：mysql-connector-java-8.0.15.zip，解压后从里面获取jar包。

确保 mysql数据库中有名称为hive的数据库
初始化初始化元数据库

 schematool -dbType mysql -initSchema

确保Hadoop启动
启动hive

#  启动
hive## 检测是否启动成功
show databases;

hive常用命令

## 启动hive
[linux01 hive]$ bin/hive## 显示数据库
hive>show databases;## 使用default数据库
hive>use default;
## 显示default数据库中的表
hive>show tables;## 创建student表, 并声明文件分隔符’\t’
hive> create table student(id int, name string) ROW FORMAT DELIMITED FIELDS TERMINATED BY ‘\t’;

Hive 安装介绍

介绍

官网

Hive的安装模式

安装

hive常用命令

相关文章：

Hive 安装介绍

npm ERR! code EPERM npm ERR! syscall unlink npm ERR!错误解决方法

redis 高级篇4 分布式锁

TPU-NNTC 编译部署LPRNet 车牌识别算法

在线/开源GNSS处理软件/平台介绍

SpringBoot集成企业微信群聊机器人消息

五、驱动 - 音频系统硬件电路

【图像分割和识别】活动形状模型（ASM）和活动外观模型（AAM）（Matlab代码实现）

HTML基础介绍2

rar压缩包怎么改成zip格式

Mac 补丁管理

【物理】带电粒子在磁场和电场中移动的 3D 轨迹研究（Matlab代码实现）

【云原生】K8S二进制搭建上篇

day49-Springboot

Day 9 字符串

Promise用法

JSP教程_编程入门自学教程_菜鸟教程-免费教程分享

极简在线商城系统，支持docker一键部署

如何微调医疗大模型llm：llama2学习笔记

生成对抗网络DCGAN学习

Visual Studio 项目属性页开发完全教程：从基础到高级

别再只用Service了！ROS1 Action通信保姆级教程：从导航进度条到任务取消，手把手教你实现带反馈的机器人任务

别再乱用npm install了！手把手教你用npx only-allow为项目指定包管理器（支持pnpm/yarn/npm）

用STM32CubeMX和HAL库快速上手WS2812B：告别手动计算延时，一键生成驱动框架

上线前最后一道防线，DeepSeek代码审查如何帮你拦截87%的CVE类缺陷？

Owl-Alpha 新手快速上手指南

企业内统一API网关与Taotoken聚合平台对接方案

Atomic Layout核心概念解析：Composition组件如何实现布局与间距分离的终极指南

如何用WaveTools终极优化《鸣潮》游戏性能：从卡顿到丝滑的完整指南

用图神经网络做缺陷定位，准确率比传统方法高出30%