当前位置: 首页 > article >正文

揭秘openGauss向量化执行引擎代价模型

揭秘openGauss向量化执行引擎代价模型openGauss的向量化执行引擎针对列存生成执行计划后根据配置项是否开启直接决定是否将执行计划转换成向量化执行计划来执行。若向量化执行引擎在行存上执行就需要将数据转换成VectorBatch即列存的形式才可执行这个转换就有代价。当向量化执行的优势没有被转换代价吃掉时行存上使用向量化执行引擎才有意义。openGauss3.0针对行存引入对向量化执行引擎的支持。通过向量化代价来估算执行计划转换是否合适。1、代价模型代价模型如下图所示它基于一个基础的代价参数体系在此基础上计算表达式计算代价、扫描代价然后层层递进计算整个执行计划的向量化代价根据向量化计划代价和普通计划代价选择合适的执行计划。openGauss仅对Agg、HashJoin、Nestloop join以及扫描包括SeqScan顺序扫描、IndexScan索引扫描、AnnIndexScan向量索引扫描、BitmapHeapScan、TidScan、FunctionScan、ForeignScan算子进行向量化代价计算其他算子认为和普通算子的代价一样。也就是这些算子的子算子输出的是行格式数据到这些算子后需要转换成向量进行计算的代价。当然该代价模型针对的是有行存表的情况如果都是列存表则不进行该代价计算。2、代码入口入口函数是try_vectorize_plan将普通执行计划转换成向量化执行计划。配置项try_vector_engine_strategy为force或者optimal并且扫描对象有列存时才会进行代价计算否则直接返回原执行计划树然后调用vector_engine_walker遍历执行计划树计算代价vector_engine_walker中遍历执行计划前会将行式引擎的代价和向量引擎的代价设置成0然后进入vector_engine_walker_internal计算。得到代价后还会加上最后向量转行的代价每条向量转换行的代价vecToRowCost0.2然后再放大1.2倍vector_engine_walker_internal的关键向量化代价计算算子如下3、CostVectorScan基础的行扫描代价为1向量扫描代价为0.9行转向量的代价为0.7。顺序扫描下1非向量代价估算的表行数*扫描一行的代价(1)过滤代价投影代价2向量化代价估算的表行数*扫描一行的代价(0.9)过滤代价过滤列转换代价投影代价投影列排除过滤列的转换代价过滤和投影的代价由函数VectorEngineCheckExpressionInternal完成根据过滤的列和投影列表做出代价计算注意各个表达式计算的基准代价值对于非顺序扫描1非向量代价估算的索引扫描行数*扫描一行的代价(1)过滤代价投影代价2向量化代价过滤代价投影代价行扫描代价行转向量代价planContext-vecCost origVecCost planContext-rowCost - origRowCost;planContext-vecCost rowToVecTransCost * exprContext.rows * list_length(scanPlan-plan.targetlist);4、CostVectorAgg聚合的向量化代价注意聚焦在投影和过滤上因为聚合操作都在投影列表所以依据子算子输出的行数进行代价计算5、CostVectorHashJoin向量化hashjoin的代价包括内部hash key列和join列以及null比较列的代价探测的代价投影列的代价6、CostVectorNestJoin向量化的代价包括join和null列的代价投影列的代价

相关文章:

揭秘openGauss向量化执行引擎代价模型

揭秘openGauss向量化执行引擎代价模型openGauss的向量化执行引擎针对列存,生成执行计划后根据配置项是否开启直接决定是否将执行计划转换成向量化执行计划来执行。若向量化执行引擎在行存上执行就需要将数据转换成VectorBatch即列存的形式才可执行,这个转…...

Spring AI:Java开发者的AI应用开发利器

Spring AI:Java开发者的AI应用开发利器 一、什么是Spring AI Spring AI是一个专为AI工程应用设计的AI应用程序框架,它将AI模型的能力集成到Spring生态系统之中。作为Spring家族的新成员,Spring AI秉承了Spring的设计理念,为Java…...

C语言内存管理常见错误与防御性编程技巧

1. 指针未初始化引发的段错误1.1 结构体成员指针未初始化在C语言中,结构体内部的指针成员并不会自动分配内存。很多初学者会犯这样的错误:struct student {char *name;int score; }stu;int main() {strcpy(stu.name, "Jimy");stu.score 99;re…...

将浮点数转换成字符串时的注意事项

String s 11625907.5798 "";这串代码存入s的不是“11625907.5798”,而是“1.16259075798E7” ,用科学计数法进行存储,所以要注意字符串的长度加了2...

RoboCore SMW_SX1276M0 LoRaWAN协议栈开发指南

1. 项目概述RoboCore SMW_SX1276M0 是一款面向嵌入式物联网终端的 LoRaWAN 协议栈封装库,专为 RoboCore LoRaWAN Bee v2.0 模块设计。该模块核心采用 Semtech SX1276 射频收发器,集成高灵敏度 LoRa 调制解调器、前向纠错(FEC)、自…...

注重自己的感受 您的感受才是衡量一切的标准

人这一辈子,最拖垮你的,从来不是没钱、没机会、没天赋,是刻在骨子里的 “模糊感”。你肯定有过这种时刻:睡前刷了两小时手机,看别人搞副业月入五位数就热血沸腾,看别人裸辞环游世界就心潮澎湃,看…...

Go的unsafe.Pointer与uintptr:手动内存管理的风险与收益

Go语言以其简洁的内存管理模型著称,但标准库中的unsafe包却为开发者提供了手动操作内存的能力。unsafe.Pointer与uintptr这两个类型,允许绕过Go的类型安全检查,直接与底层内存交互。这种能力虽然强大,却也伴随着极高的风险。本文将…...

【Overview Effect】 -在抵达月球之前,让我们最后一次眺望地球

“当我们前往月球时,我们专注于探索月球,但实际上我们发现的是地球。” —— 这种视角让人们意识到,地球不仅是家园,更是一艘在寒冷宇宙中孤立无援的“救生船”。在抵达月球之前,让我们最后一次眺望地球。这张地球照片…...

OpenClaw排错大全:Phi-3-mini-128k-instruct接口连接失败7种解决方案

OpenClaw排错大全:Phi-3-mini-128k-instruct接口连接失败7种解决方案 1. 问题背景与排查思路 上周我在本地部署Phi-3-mini-128k-instruct模型时,遇到了OpenClaw连接失败的棘手问题。控制台不断报错"Model connection timeout",但…...

告别抓瞎!手把手教你用Wireshark解密TLS 1.3流量(附SSLKEYLOGFILE环境变量配置)

从密文到明文:实战解密TLS 1.3流量的完整指南 当你在调试一个API接口时,发现请求总是返回异常状态码,但查看Wireshark抓包却只能看到一堆加密的TLS 1.3数据包,这种"睁眼瞎"的感觉确实令人沮丧。TLS 1.3作为目前最安全的…...

告别龟速下载!在VMware里给UOS 20和CentOS 8配置本地yum源(保姆级图文)

企业级虚拟化环境下的高效软件管理:UOS与CentOS本地源深度配置指南 当你在企业内网或隔离开发环境中,是否经历过这样的场景:急需安装一个关键依赖包,却因为网络限制或带宽瓶颈,眼睁睁看着进度条以KB/s的速度缓慢爬行&a…...

OpenClaw开源贡献:为Qwen3.5-9B-AWQ-4bit开发社区技能

OpenClaw开源贡献:为Qwen3.5-9B-AWQ-4bit开发社区技能 1. 为什么选择为OpenClaw开发技能? 去年冬天,当我第一次在本地部署OpenClaw时,就被它的设计理念所吸引——一个真正能在个人电脑上运行的AI智能体框架。但很快我发现&#…...

[复现]神经网络(NN)+模型预测控制(MPC)算法、四旋翼无人机+非线性机器人汽车系统研究(Matlab代码实现)

💥💥💞💞欢迎来到本博客❤️❤️💥💥 🏆博主优势:🌞🌞🌞博客内容尽量做到思维缜密,逻辑清晰,为了方便读者。 ⛳️座右铭&a…...

如何高效提取Android OTA包:payload-dumper-go完整使用指南

如何高效提取Android OTA包:payload-dumper-go完整使用指南 【免费下载链接】payload-dumper-go an android OTA payload dumper written in Go 项目地址: https://gitcode.com/gh_mirrors/pa/payload-dumper-go 在Android系统开发和维护过程中,处…...

用Docker三分钟部署MetaGPT开发环境(附LLM本地化方案)

三分钟容器化部署MetaGPT全栈开发环境实战指南 容器化部署的价值与优势 在当今快速迭代的AI开发领域,环境配置一直是困扰开发者的首要难题。传统部署方式需要处理Python版本管理、依赖冲突、CUDA驱动兼容等复杂问题,而容器化技术为这一痛点提供了优雅的解…...

seo北京优化和网站内容优化有什么联系

SEO北京优化与网站内容优化的紧密联系 在当今互联网时代,对于任何企业来说,网站的优化是至关重要的一环。尤其是在竞争激烈的北京市场,SEO(搜索引擎优化)和网站内容优化之间的关系更加紧密。本文将从问题分析、原因说…...

西门子1500T插补控制从入门到精通:手把手教你配置直线与圆弧轨迹(附程序源码)

西门子1500T插补控制从入门到精通:手把手教你配置直线与圆弧轨迹(附程序源码) 在工业自动化领域,精确控制多轴协同运动一直是核心挑战。想象一下机械臂需要画一个完美的圆,或者CNC机床要切割复杂曲线——这些场景都离不…...

SAP MM新手避坑指南:手把手教你搞定UB型STO库存调拨(从ME21N到MIGO全流程)

SAP MM新手避坑指南:手把手教你搞定UB型STO库存调拨(从ME21N到MIGO全流程) 刚接触SAP MM模块的新手,面对库存转储订单(STO)这个看似简单实则暗藏玄机的功能时,往往会在UB型订单的创建和操作过程…...

开发环境神器:OpenClaw+Qwen3-14B镜像自动化调试与日志分析

开发环境神器:OpenClawQwen3-14B镜像自动化调试与日志分析 1. 为什么开发者需要自动化调试助手 作为一名全栈开发者,我每天要面对各种复杂的调试场景:前端页面渲染异常、后端接口返回500错误、数据库查询性能低下...传统的调试方式需要手动…...

从零到一:基于XXL-JOB构建企业级分布式任务调度中心实战指南

1. 为什么选择XXL-JOB作为分布式任务调度方案 第一次接触分布式任务调度时,我像大多数开发者一样面临选择困难。市面上既有成熟的商业产品,也有各种开源方案。经过多个项目的实战验证,XXL-JOB以其轻量级架构和易用性脱颖而出。这个由国内开发…...

CVPR2025新思路:把对抗扰动本身当成‘训练数据’,聊聊PSP-UAP背后的设计哲学

CVPR2025新思路:对抗扰动作为训练数据的革命性设计哲学 对抗样本研究领域正在经历一场范式转变——从单纯制造攻击工具到重新思考扰动本身的语义价值。PSP-UAP(Pseudo-Semantic Prior Universal Adversarial Perturbation)的突破性在于&#…...

从零到一:STM32 SPWM逆变器设计全流程解析

从零到一:STM32 SPWM逆变器设计全流程解析 在新能源和电力电子领域,逆变器作为直流转交流的关键设备,其设计能力已成为工程师的核心竞争力之一。而基于STM32的SPWM逆变器设计,因其高性价比和灵活可控的特点,正成为工业…...

Manim进阶技巧:如何用Python代码制作复杂的数学动画

Manim进阶技巧:如何用Python代码制作复杂的数学动画 数学可视化是理解抽象概念的有力工具,而Manim作为3Blue1Brown开发的数学动画引擎,已经成为科研、教育和科普领域的首选工具。当你已经掌握了基础图形的创建和简单动画效果后,如…...

告别手动操作!手把手教你用影刀RPA+钉钉机器人打造自动化工作流(附完整配置截图)

零代码革命:用影刀RPA钉钉机器人实现行政工作全自动化 行政部门的张琳每天早晨都要重复同样的工作:登录五个系统导出数据、整理成Excel报表、手动发送到十个钉钉群。这种机械性操作不仅消耗两小时黄金时间,还常因人为疏忽导致数据错误。直到她…...

Java版Playwright实战:从零开始搭建自动化测试框架(含完整代码示例)

Java版Playwright实战:从零开始搭建自动化测试框架(含完整代码示例) 在当今快节奏的软件开发环境中,自动化测试已成为保障产品质量不可或缺的一环。对于Java开发者而言,Playwright以其跨浏览器支持、现代化API设计和出…...

seo代理与网站优化公司的区别在哪里

SEO代理与网站优化公司的区别在哪里 在当今竞争激烈的互联网市场中,各种形式的数字营销服务层出不穷。其中,SEO(搜索引擎优化)和网站优化服务尤为重要。许多人对于SEO代理和网站优化公司的区别却一知半解。本文将详细探讨这两者的…...

GZCTF动态Flag题目从开发到上架全流程:以Python Flask镜像为例

GZCTF动态Flag题目开发与部署实战指南:Python Flask全流程解析 在CTF竞赛生态中,动态Flag机制已成为现代赛题设计的黄金标准。不同于传统静态Flag容易被暴力破解或直接泄露,动态Flag为每个参赛队伍生成唯一标识,大幅提升题目安全性…...

OpenClaw二次开发:为Qwen3.5-9B增加区域截图分析

OpenClaw二次开发:为Qwen3.5-9B增加区域截图分析 1. 为什么需要区域截图分析功能 上周我需要处理一个重复性工作——每天从几十张监控截图中提取特定区域的文字信息。现有的全屏截图大模型分析方案存在三个明显痛点: 无效信息干扰:全屏截图…...

CenterPoint实战:基于热力图的3D目标检测与跟踪全解析

1. CenterPoint算法核心思想解析 第一次接触CenterPoint时,最让我惊讶的是它的简洁性。传统3D目标检测就像在游乐场玩"套圈"游戏——需要准备各种尺寸的圆圈(锚框)去匹配不同形状的奖品(物体),而…...

生物信息学避坑指南:Scissor算法参数alpha和cutoff的黄金设置法则

生物信息学避坑指南:Scissor算法参数alpha和cutoff的黄金设置法则 在单细胞数据分析领域,如何有效整合bulk RNA测序数据与单细胞数据一直是研究者面临的挑战。Scissor算法通过巧妙设计,能够从含有表型的bulk RNA数据中提取关键信息&#xff0…...