Apache Doris 入门教程26:资源管理
为了节省Doris集群内的计算、存储资源,Doris需要引入一些其他外部资源来完成相关的工作,如Spark/GPU用于查询,HDFS/S3用于外部存储,Spark/MapReduce用于ETL, 通过ODBC连接外部存储等,因此我们引入资源管理机制来管理Doris使用的这些外部资源。
基本概念
一个资源包含名字、类型等基本信息,名字为全局唯一,不同类型的资源包含不同的属性,具体参考各资源的介绍。
资源的创建和删除只能由拥有 admin 权限的用户进行操作。一个资源隶属于整个Doris集群。拥有 admin 权限的用户可以将使用权限usage_priv 赋给普通用户。可参考HELP GRANT或者权限文档。
具体操作
资源管理主要有三个命令:CREATE RESOURCE,DROP RESOURCE和SHOW RESOURCES,分别为创建、删除和查看资源。这三个命令的具体语法可以通过MySQL客户端连接到 Doris 后,执行 HELP cmd 的方式查看帮助。
-
CREATE RESOURCE
该语句用于创建资源。具体操作可参考 CREATE RESOURCE。
-
DROP RESOURCE
该命令可以删除一个已存在的资源。具体操作见 DROP RESOURCE 。
-
SHOW RESOURCES
该命令可以查看用户有使用权限的资源。具体操作见 SHOW RESOURCES。
支持的资源
目前Doris能够支持
- Spark资源 : 完成ETL工作。
- ODBC资源:查询和导入外部表的数据
下面将分别展示两种资源的使用方式。
Spark
参数
Spark 相关参数如下:
spark.master: 必填,目前支持yarn,spark://host:port。
spark.submit.deployMode: Spark 程序的部署模式,必填,支持 cluster,client 两种。
spark.hadoop.yarn.resourcemanager.address: master为yarn时必填。
spark.hadoop.fs.defaultFS: master为yarn时必填。
其他参数为可选,参考Configuration - Spark 3.4.1 Documentation
如果Spark用于ETL,还需要指定以下参数:
working_dir: ETL 使用的目录。spark作为ETL资源使用时必填。例如:hdfs://host:port/tmp/doris。
broker: broker 名字。spark作为ETL资源使用时必填。需要使用ALTER SYSTEM ADD BROKER 命令提前完成配置。
broker.property_key: broker读取ETL生成的中间文件时需要指定的认证信息等。
示例
创建 yarn cluster 模式,名为 spark0 的 Spark 资源。
CREATE EXTERNAL RESOURCE "spark0"
PROPERTIES
("type" = "spark","spark.master" = "yarn","spark.submit.deployMode" = "cluster","spark.jars" = "xxx.jar,yyy.jar","spark.files" = "/tmp/aaa,/tmp/bbb","spark.executor.memory" = "1g","spark.yarn.queue" = "queue0","spark.hadoop.yarn.resourcemanager.address" = "127.0.0.1:9999","spark.hadoop.fs.defaultFS" = "hdfs://127.0.0.1:10000","working_dir" = "hdfs://127.0.0.1:10000/tmp/doris","broker" = "broker0","broker.username" = "user0","broker.password" = "password0"
);
ODBC
参数
ODBC 相关参数如下:
type: 必填,且必须为odbc_catalog。作为resource的类型标识。
user: 外部表的账号,必填。
password: 外部表的密码,必填。
host: 外部表的连接ip地址,必填。
port: 外部表的连接端口,必填。
odbc_type: 标示外部表的类型,当前doris支持mysql与oracle,未来可能支持更多的数据库。引用该resource的ODBC外表必填,旧的mysql外表选填。
driver: 标示外部表使用的driver动态库,引用该resource的ODBC外表必填,旧的mysql外表选填。
具体如何使用可以,可以参考ODBC of Doris
示例
创建oracle的odbc resource,名为 odbc_oracle 的 odbc_catalog的 资源。
CREATE EXTERNAL RESOURCE `oracle_odbc`
PROPERTIES (
"type" = "odbc_catalog",
"host" = "192.168.0.1",
"port" = "8086",
"user" = "test",
"password" = "test",
"database" = "test",
"odbc_type" = "oracle",
"driver" = "Oracle 19 ODBC driver"
);相关文章:
Apache Doris 入门教程26:资源管理
为了节省Doris集群内的计算、存储资源,Doris需要引入一些其他外部资源来完成相关的工作,如Spark/GPU用于查询,HDFS/S3用于外部存储,Spark/MapReduce用于ETL, 通过ODBC连接外部存储等,因此我们引入资源管理机制来管理Do…...
【金融量化】Python实现根据收益率计算累计收益率并可视化
1 理论 理财产品(本金100元) 第1天:3% :(13%) ✖ 100 103 第2天:2% :(12%)✖ 以上 103 2.06 第3天:5% : (15%)✖ 以上…...
解读spring中@Value 如何将配置转自定义的bean
实现方式 着急寻求解决方式的猿友先看这块 定义配置转化类 public class UserConverter implements Converter<String, List<User>> {Overridepublic List<User> convert(String config) {if (StringUtils.isEmpty(config)) {return Collections.emptyLis…...
前端开发实习总结参考范文(合集)
▼前端开发实习总结篇一 今天就简单聊聊上面的StrutsSpringHibernate吧。 Struts 代表:表示层;Spring代表:业务逻辑层;Hibernate则代表持久层。他们是目前在Java Web编程开发中用得最多的框架,其实这样区分是为了适应软件开发过程中各个分工…...
♥ vue中$forceUpdate()
♥ vue中$forceUpdate() 1、认识 强制该组件重新渲染 鉴于 Vue 的全自动响应性系统,这个功能应该很少会被用到 $forceUpdate()迫使vue实例重新(rander)渲染虚拟DOM,注意并不是重新加载组件。 结合vue的生命周期,调用…...
Java一般用于postgis空间数据库通用的增删查改sql命令
目录 1 增加 2 删除 3 查询 4 更新 "public"."JGSQGW_Geo"为某模式下得表 一般postgrel有这样的设计模式 1 增加 #前端绘制出的数据插入 INSERT INTO "public"."JGSQGW_Geo" ( "geom","gridone","gridon…...
【C++类和对象】类有哪些默认成员函数呢?(上)
目录 1. 类的6个默认成员函数 2. 构造函数(*^▽^*) 2.1 概念 2.2 特性 3. 析构函数(*^▽^*) 3.1 概念 3.2 特性 4. 拷贝构造函数(*^▽^*) 4.1 概念 4.2 特性 5. 赋值运算符重载(*^▽^*) 5.1 运算符重载 5.2 赋值运算符重载 ヾ(๑╹◡╹)ノ"人总要为…...
(docker)mysql镜像拉取-创建容器-容器的使用【个人笔记】
【容器的第一次创建】 容器的第一次创建,需要先下载镜像,从 镜像拉取 0、可以搜索镜像的版本 docker search mysql1、先拉取MySQL的镜像,默认拉取最新版,使用下面的命令拉取mysql镜像 docker pull mysql也可以指定mysql的版本…...
【时间格式引发的事故】
时间格式引发的事故 背景实战演示结论 背景 前不久写了一个删除数据接口,条件是根据时间删除时间后面的数据。入参是 时间字符串。后台的时间格式 是 yyyyMMdd。然后当时前端传参数的时候,随意的传了2023-07-31的时间,然后将该表的数据全部删…...
【数据结构】栈及其实现
目录 1.栈的概念及结构 2.栈的实现 2.1栈结构定义 2.2初始化及销毁 2.3插入数据 2.4删除数据 2.5访问栈顶数据 2.6判断是否为空栈 2.7计算栈的大小 3.8访问栈中所有数据 1.栈的概念及结构 栈:栈是一种特殊的线性表,其只允许在固定的一端进行插…...
Linux命令200例:mount将文件系统挂载到指定目录下(常用)
🏆作者简介,黑夜开发者,全栈领域新星创作者✌。CSDN专家博主,阿里云社区专家博主,2023年6月csdn上海赛道top4。 🏆数年电商行业从业经验,历任核心研发工程师,项目技术负责人。 &…...
互联网摸鱼日报(2023-08-11)
互联网摸鱼日报(2023-08-11) 36氪新闻 年景不稳,市场人活成创始人 石油巨头开始疯抢锂矿,美国也开始讲“锂”了? 公司监控员工键盘 49 天,18 年老员工被解雇:因为“打字不够”? 这不是危言耸听…...
第十五章、【Linux】例行性工作调度
15.1 什么是例行性工作调度 在不考虑硬件与服务器的链接状态下,Linux可以帮助提醒许多任务。Linux调度就是通过crontab与at这两个东西。 15.1.1 Linux工作调度的种类:at,cron 从上面的说明当中,我们可以很清楚的发现两种工作调度的方式&am…...
基于Promise.resolve实现Koa请求队列中间件
本文作者为360奇舞团前端工程师 前言 最近在做一个 AIGC 项目,后端基于 Koa2 实现。其中有一个需求就是调用兄弟业务线服务端 AIGC 能力生成图片。但由于目前兄弟业务线的 AIGC 项目也是处于测试阶段,能够提供的服务器资源有限,当并发请求资源…...
【结构型设计模式】C#设计模式之桥接模式
题目:设计一个桥接模式来实现图形和颜色之间的解耦。 解析: 桥接模式是一种结构型设计模式,它将抽象部分与实现部分分离,使它们可以独立变化。在这个例子中,抽象部分是图形(如圆形、正方形)&am…...
【12】Git工具 协同工作平台使用教程 Gitee使用指南 腾讯工蜂使用指南【Gitee】【腾讯工蜂】【Git】
tips:少量的git安装和使用教程,更多讲快速使用上手Gitee和工蜂平台 一、准备工作 1、下载git Git - Downloads (git-scm.com) 找到对应操作系统,对应版本,对应的位数 下载后根据需求自己安装,然后用git --version验…...
zookeeper增加IP白名单-安全设置
简介: zookeeper未授权访问漏洞,处理这个漏洞最简单,常用的应该就是给zookeeper添加用户名、密码验证,如果项目比较急,且代码不支持zookeeper的用户名、密码验证,那采用ip白名单过滤,无疑是最快…...
Mac 调试 ios safar
1. 打开Mac的 Safari 浏览器的“开发”菜单 运行 Safari 浏览器,然后依次选取“Safari 浏览器”>“偏好设置”,点按“高级”面板,然后勾选“在菜单栏中显示开发菜单”。 2. 开启IPhone的Safari调试模式 启用 Web 检查 功能,打…...
Linu网络服务NFS
linux网络服务NFS 一.NFS简介二.NFS原理三.NFS优势四.配置文件五.NFS共享存储服务的操作步骤 一.NFS简介 NFS(网络文件服务) NFS是一种基于tcp/ip传输的网络文件系统协议,最初由sun公司开放通过使用NFS协议,客户机可以像访问本地…...
24届近5年同济大学自动化考研院校分析
今天给大家带来的是同济大学控制考研分析 满满干货~还不快快点赞收藏 一、同济大学 学校简介 同济大学历史悠久、声誉卓著,是中国最早的国立大学之一,是教育部直属并与上海市共建的全国重点大学。经过115年的发展,同济大学已经…...
如何在3分钟内掌握JiYuTrainer:极域电子教室防控制终极指南
如何在3分钟内掌握JiYuTrainer:极域电子教室防控制终极指南 【免费下载链接】JiYuTrainer 极域电子教室防控制软件, StudenMain.exe 破解 项目地址: https://gitcode.com/gh_mirrors/ji/JiYuTrainer 你是否厌倦了在电脑课上被极域电子教室的全屏广播控制&…...
中兴光猫工厂模式终极开启指南:zteOnu工具完整使用教程
中兴光猫工厂模式终极开启指南:zteOnu工具完整使用教程 【免费下载链接】zteOnu A tool that can open ZTE onu device factory mode 项目地址: https://gitcode.com/gh_mirrors/zt/zteOnu 你是否遇到过想要调整中兴光猫的高级设置,却发现普通用户…...
Nomic-Embed-Text-V2-MoE企业内训:Java面试题中的算法与数据结构优化思路
Nomic-Embed-Text-V2-MoE企业内训:Java面试题中的算法与数据结构优化思路 1. 引言 最近在帮团队做技术内训,发现一个挺有意思的现象:大家准备Java面试,尤其是算法和数据结构部分,还是老一套——刷题海。LeetCode刷了…...
OpenClaw技能市场巡礼:百川2-13B-4bits模型十佳必备插件
OpenClaw技能市场巡礼:百川2-13B-4bits模型十佳必备插件 1. 为什么选择百川2-13B-4bits模型作为OpenClaw的智能核心? 去年冬天,当我第一次在本地机器上部署百川2-13B-4bits模型时,就被它的性价比震惊了。作为一个长期在消费级显…...
CLAUDE.md 写到 500 行还管不住 AI?Skills 分层食用指南 + AGENTS.md 跨工具吃遍天下
一个资深 Claude Code 用户的心路历程:从写 CLAUDE.md 写到手抽筋,到三层 Skills 按需拼装,再到一份规则走通 Codex、Cursor、Aider 全家桶。这篇把坑都给你踩平。 写在前面 场景还原一下: 你在项目 A 里精心写了一份 CLAUDE.md…...
[具身智能-291]:计算机音频主要的功能、常见的库和工具
计算机音频领域涉及从底层的信号处理到上层的应用开发,其功能、库和工具种类繁多。以下为你梳理了计算机音频的主要功能以及在不同编程语言和场景下常见的库与工具。🎵 计算机音频的主要功能计算机音频处理的核心是围绕数字信号展开的,主要功…...
PyTorch 2.8 环境搭建:简单几步完成GPU加速配置
PyTorch 2.8 环境搭建:简单几步完成GPU加速配置 你是不是刚拿到一块新显卡,兴冲冲地想跑个深度学习模型试试性能,结果第一步就被环境配置给难住了?CUDA版本怎么选?PyTorch和CUDA怎么匹配?驱动要不要升级&a…...
AB测试中的因果推断陷阱:为什么你的随机化试验可能不靠谱?
AB测试中的因果推断陷阱:为什么你的随机化试验可能不靠谱? 在电商大促期间,某平台将"满200减30"的优惠券随机发放给50%用户,一周后发现实验组GMV提升12%,看似效果显著。但进一步分析发现,实验组中…...
深入浅出Linux ftrace:从内核配置到实战分析(附debugfs挂载全流程)
深入浅出Linux ftrace:从内核配置到实战分析 在Linux系统开发与调试过程中,内核级追踪工具的重要性不言而喻。面对复杂的系统行为、性能瓶颈或难以复现的偶发问题,传统的日志和调试手段往往力不从心。ftrace作为Linux内核原生提供的轻量级追踪…...
生产环境部署 AI Agent 的最佳实践
生产环境部署 AI Agent 的最佳实践 第一部分 生产AI Agent的爆发与部署困境深度剖析 (本部分约12000字) 1.1 核心概念:从“玩具Agent”到“生产级Agent”的定义边界 1.1.1 什么是广义的AI Agent? 在过去两年里,“AI Agent”无疑是大模型(LLMs)生态系统中最炙手可热的…...
