当前位置：首页 > news >正文

Apache Calcite - 基于规则的查询优化

news 2026/5/14 15:16:14

基于规则的查询优化

基于规则的查询优化（Rule-based Query Optimization）是一种通过应用一系列预定义的规则来优化查询计划的技术。这些规则描述了如何转换关系表达式，以提高查询执行的效率。基于规则的优化器并不依赖于统计信息，而是通过模式匹配和规则应用来改进查询计划。

规则（Rules）：规则是优化器用来转换关系表达式的基本单位。每条规则定义了一个模式（Pattern）和一个转换（Transformation）。当优化器检测到关系表达式中匹配该模式的部分时，就会应用相应的转换。
模式匹配（Pattern Matching）：优化器会遍历关系表达式树，并尝试找到与规则模式匹配的部分。一旦找到匹配的部分，就会应用相应的转换。
转换（Transformation）：转换是对匹配模式的关系表达式进行修改的操作。转换后的表达式通常会具有更高的执行效率。
优化器（Optimizer）：优化器是应用规则的引擎。Apache Calcite中有多种优化器实现，如HepPlanner（基于规则的优化器）和VolcanoPlanner（基于代价的优化器）。

Calcite中的规则RelOptRule

RelOptRule 是 Apache Calcite 中用于定义查询优化规则的基类。通过继承 RelOptRule，可以创建自定义的优化规则，以便在查询优化过程中应用这些规则。以下是对 RelOptRule 及其常见子类的详细介绍。

RelOptRule: RelOptRule 是一个抽象类，用于定义查询优化规则。每个规则包含一个模式（Pattern），用于匹配关系表达式树中的特定结构。当优化器检测到关系表达式中匹配该模式的部分时，就会应用相应的转换。

构造函数

operand：定义规则匹配的模式。
description：规则的描述，用于调试和日志记录。

protected RelOptRule(RelOptRuleOperand operand, String description)

主要方法

onMatch(RelOptRuleCall call)：当规则的模式匹配成功时调用，用于执行具体的转换逻辑。
matches(RelOptRuleCall call)：检查规则是否适用于当前的匹配上下文，默认实现返回 true。
toString()：返回规则的描述信息。

RelOptRule的常用子类简介

ProjectFilterTransposeRule：ProjectFilterTransposeRule 将 Project 操作下推到 Filter 之后，从而减少不必要的数据传输和处理。
FilterJoinRule：FilterJoinRule 将 Filter 操作下推到 Join 之前，或者将过滤条件分解并分别应用到连接的两侧。
JoinCommuteRule：JoinCommuteRule 交换 Join 操作的左右输入，从而可能找到更优的连接顺序。

CoreRules

CoreRules 是 Apache Calcite 提供的一组默认的优化规则集合。这些规则覆盖了常见的查询优化场景，如投影下推、谓词下推、连接重排序等。CoreRules 中的规则大多是通过继承 RelRule 或其子类来实现的。

/** Rule that recognizes an {@link Aggregate}* on top of a {@link Project} and if possible* aggregates through the Project or removes the Project. */public static final AggregateProjectMergeRule AGGREGATE_PROJECT_MERGE =AggregateProjectMergeRule.Config.DEFAULT.toRule();/** Rule that removes constant keys from an {@link Aggregate}. */public static final AggregateProjectPullUpConstantsRuleAGGREGATE_PROJECT_PULL_UP_CONSTANTS =AggregateProjectPullUpConstantsRule.Config.DEFAULT.toRule();/** More general form of {@link #AGGREGATE_PROJECT_PULL_UP_CONSTANTS}* that matches any relational expression. */public static final AggregateProjectPullUpConstantsRuleAGGREGATE_ANY_PULL_UP_CONSTANTS =AggregateProjectPullUpConstantsRule.Config.DEFAULT.withOperandFor(LogicalAggregate.class, RelNode.class).toRule();

HepPlanner

在Apache Calcite中，HepPlanner 是 RelOptPlanner 接口的一个启发式（heuristic）实现。这里的“启发式”具体指的是使用启发式方法来指导查询优化过程，而不是基于全面的成本模型来评估每一个可能的查询计划。启发式方法通常依赖于规则和经验法则（heuristics）来快速找到一个足够好的解决方案，而不是最优解。

启发式方法在计算机科学中通常指的是通过经验法则、直觉或启发式规则来解决问题的方法。这些方法不保证找到最优解，但通常能够在合理的时间内找到一个较好的解决方案。启发式方法在查询优化中尤其重要，因为查询优化问题通常是NP难题，全面搜索所有可能的查询计划是不可行的。

一个基于规则变换的案例

要优化的Sql如下，我们将使用下推规则ProjectFilterTransposeRule来进行优化

"SELECT age FROM your_table WHERE age > 30";

org.apache.calcite.rel.rules.ProjectFilterTransposeRule 规则含义

Rule that pushes a Project past a Filter.

将投影下推到过滤操作之后。这里的“之后”并不是指执行顺序上的“之后”，而是指在查询计划树结构中的位置变化。具体来说，这意味着在查询计划树中，Project 操作会被移动到 Filter 操作的下方（即子节点），从而在逻辑上首先进行投影操作，然后再进行过滤操作。

原查询计划
LogicalProject(a=[$0], b=[$1])LogicalFilter(condition=[=($0, 'b')])LogicalTableScan(table=[[c]])下推后的查询计划
LogicalFilter(condition=[=($0, 'b')])LogicalProject(a=[$0], b=[$1])LogicalTableScan(table=[[c]])

Java演示代码

import java.sql.Connection;
import java.sql.DriverManager;
import java.util.Properties;
import org.apache.calcite.config.Lex;
import org.apache.calcite.jdbc.CalciteConnection;
import org.apache.calcite.plan.hep.HepPlanner;
import org.apache.calcite.plan.hep.HepProgram;
import org.apache.calcite.plan.hep.HepProgramBuilder;
import org.apache.calcite.rel.RelNode;
import org.apache.calcite.rel.RelRoot;
import org.apache.calcite.rel.rel2sql.RelToSqlConverter;
import org.apache.calcite.rel.rel2sql.SqlImplementor.Result;
import org.apache.calcite.rel.rules.CoreRules;
import org.apache.calcite.rel.type.RelDataType;
import org.apache.calcite.rel.type.RelDataTypeFactory;
import org.apache.calcite.schema.Schema;
import org.apache.calcite.schema.SchemaPlus;
import org.apache.calcite.schema.Table;
import org.apache.calcite.schema.impl.AbstractSchema;
import org.apache.calcite.schema.impl.AbstractTable;
import org.apache.calcite.sql.SqlNode;
import org.apache.calcite.sql.dialect.MysqlSqlDialect;
import org.apache.calcite.sql.parser.SqlParser;
import org.apache.calcite.sql.pretty.SqlPrettyWriter;
import org.apache.calcite.sql.validate.SqlConformanceEnum;
import org.apache.calcite.tools.FrameworkConfig;
import org.apache.calcite.tools.Frameworks;
import org.apache.calcite.tools.Planner;
import org.junit.Test;/****/
public class OptSqlByRelNode2 {@Testpublic void testSqlToRelNode2() throws Exception{// 1. 设置内存数据库连接Properties info = new Properties();Connection connection = DriverManager.getConnection("jdbc:calcite:", info);CalciteConnection calciteConnection = connection.unwrap(CalciteConnection.class);// 2. 创建自定义SchemaSchemaPlus rootSchema = calciteConnection.getRootSchema();Schema schema = new AbstractSchema() {};rootSchema.add("MY_SCHEMA", schema);// 3. 添加表到自定义SchemaTable yourTable = new AbstractTable() {@Overridepublic RelDataType getRowType(RelDataTypeFactory typeFactory) {// 如果要动态分析表，那么就自己去创建return typeFactory.builder().add("id", typeFactory.createJavaType(int.class)).add("name", typeFactory.createJavaType(String.class)).add("age", typeFactory.createJavaType(int.class)).build();}};// 3. 添加表到自定义SchemaTable department_table = new AbstractTable() {@Overridepublic RelDataType getRowType(RelDataTypeFactory typeFactory) {// 如果要动态分析表，那么就自己去创建return typeFactory.builder().add("id", typeFactory.createJavaType(int.class)).add("department", typeFactory.createJavaType(String.class)).add("location", typeFactory.createJavaType(String.class)).build();}};rootSchema.getSubSchema("MY_SCHEMA").add("your_table", yourTable);rootSchema.getSubSchema("MY_SCHEMA").add("department_table", department_table);// 4. 配置SQL解析器SqlParser.Config parserConfig = SqlParser.config().withLex(Lex.MYSQL).withConformance(SqlConformanceEnum.MYSQL_5);// 5. 配置框架FrameworkConfig config = Frameworks.newConfigBuilder().parserConfig(parserConfig).defaultSchema(rootSchema.getSubSchema("MY_SCHEMA")) // 使用自定义Schema.build();// 6. 创建Planner实例Planner planner = Frameworks.getPlanner(config);// 7. 解析SQLString sql = "SELECT age FROM your_table WHERE age > 30";
//        String sql = "SELECT * FROM your_table where id = 1 and name = 'you_name'";SqlNode sqlNode = planner.parse(sql);// 8. 验证SQLSqlNode validatedSqlNode = planner.validate(sqlNode);// 9. 转换为关系表达式RelRoot relRoot = planner.rel(validatedSqlNode);// 10. 获取RelNodeRelNode rootRelNode = relRoot.rel;// 打印RelNode的信息System.out.println(rootRelNode.explain());// 创建HepProgramHepProgram hepProgram = new HepProgramBuilder()
//            .addRuleInstance(CoreRules.FILTER_PROJECT_TRANSPOSE)
//            .addRuleInstance(CoreRules.FILTER_INTO_JOIN)
//            .addRuleInstance(CoreRules.FILTER_AGGREGATE_TRANSPOSE)
//            .addRuleInstance(CoreRules.FILTER_SET_OP_TRANSPOSE).addRuleInstance(CoreRules.PROJECT_FILTER_TRANSPOSE)
//            .addRuleInstance(CoreRules.PROJECT_JOIN_TRANSPOSE).build();// 创建HepPlannerHepPlanner hepPlanner = new HepPlanner(hepProgram);// 设置根RelNodehepPlanner.setRoot(rootRelNode);// 进行优化RelNode optimizedRelNode = hepPlanner.findBestExp();// 输出优化后的RelNodeSystem.out.println("优化后的RelNode: \n" + optimizedRelNode.explain());// 10. 使用RelToSqlConverter将优化后的RelNode转换回SQLRelToSqlConverter relToSqlConverter = new RelToSqlConverter(MysqlSqlDialect.DEFAULT);Result result = relToSqlConverter.visitRoot(optimizedRelNode);SqlNode sqlNodeConverted = result.asStatement();// 11. 使用SqlPrettyWriter格式化SQLSqlPrettyWriter writer = new SqlPrettyWriter();String convertedSql = writer.format(sqlNodeConverted);// 输出转换后的SQLSystem.out.println("优化后的SQL: " + convertedSql);// 关闭连接connection.close();}
}

转换后的Sql

SQL: SELECT *
FROM (SELECT "age"FROM "MY_SCHEMA"."your_table") AS "t"
WHERE "age" > 30

变换后的关系表达式

LogicalFilter(condition=[>($0, 30)])LogicalProject(age=[$2])LogicalTableScan(table=[[MY_SCHEMA, your_table]])

总结

使用HepPlanner基于规则对Sql进行优化，最终产生优化后的关系表达式

Apache Calcite - 基于规则的查询优化

基于规则的查询优化

Calcite中的规则RelOptRule

RelOptRule的常用子类简介

CoreRules

HepPlanner

一个基于规则变换的案例

总结

相关文章：

Apache Calcite - 基于规则的查询优化

react学习笔记，ReactDOM，react-router-dom

优化UVM环境（八）-整理project_common_pkg文件

【实战案例】Django框架连接并操作数据库MySQL相关API

【其他】无法启动phptudy服务，提示错误2:系统找不到指定的文件

AI驱动的支持截图或线框图快速生成网页应用的开源项目

es集群索引是黄色

获取淘宝商品评论的方法分享-调用API接口item_review

MATLAB人脸考勤系统

Spring篇（事务篇 - 基础介绍）

qt EventFilter用途详解

[ 钓鱼实战系列-基础篇-6 ] 一篇文章让你了解邮件服务器机制(SMTP/POP/IMAP)-1

wordpress伪静态规则

缓存框架JetCache源码解析-缓存定时刷新

docker配置mysql8报错 ERROR 2002 (HY000)

【Linux】为什么环境变量具有全局性？共享？写时拷贝优化？

如何在Linux中找到MySQL的安装目录

机器人备件用在哪些领域

基于单片机优先级的信号状态机设计

数字电路week3

VisionPro新手避坑指南：从CogPMAlignTool到Blob分析，这10个工具别再乱用了

如何快速入门ROS机器人仿真：WPR系列仿真工具完整指南

黑群晖/白群晖通用！Docker部署DDNS-Go搞定腾讯云域名解析（保姆级避坑指南）

9大网盘下载限速破解终极指南：LinkSwift让你告别龟速下载烦恼

【Matlab】MATLAB教程：Simulink与MATLAB交互（MATLAB函数模块案例+混合编程仿真）

《机密计算破局政务金融、截图工具漏洞泄露NTLM哈希、智能体仿冒日增200+：AI安全的三场“攻防战”》

自动驾驶汽车保险七大议题：从技术视角看责任转移与系统设计

如何用DownKyi实现B站视频自由：5个实用场景与解决方案

JIT只适合大厂？精益生产中小厂JIT落地技巧，不用大投入也能降库存！

GPU加速时序驱动布局优化技术解析