当前位置：首页 > news >正文

（二开）Flink 修改源码拓展 SQL 语法

news 2025/11/8 20:52:25

1、Flink 扩展 calcite 中的语法解析

1）定义需要的 SqlNode 节点类-以 SqlShowCatalogs 为例

a）类位置

flink/flink-table/flink-sql-parser/src/main/java/org/apache/flink/sql/parser/dql/SqlShowCatalogs.java

在这里插入图片描述

核心方法：

@Override
public void unparse(SqlWriter writer, int leftPrec, int rightPrec) {writer.keyword("SHOW CATALOGS");}

b）类血缘

在这里插入图片描述

2）修改 includes 目录下的 .ftl 文件，在 parserImpls.ftl 文件中添加语法逻辑

a）文件位置

在这里插入图片描述

b）语法示例

/**
* Parse a "Show Catalogs" metadata query command.
*/
SqlShowCatalogs SqlShowCatalogs() :
{
}
{<SHOW> <CATALOGS>{return new SqlShowCatalogs(getPos());}
}

3）将 Calcite 源码中的 config.fmpp 文件复制到项目的 src/main/codegen 目录下，修改内容，来声明扩展的部分

a）文件位置

在这里插入图片描述

b）config.fmpp 内容

data: {# 解析器文件路径parser: tdd(../data/Parser.tdd)
}# 扩展文件的目录
freemarkerLinks: {includes: includes/
}

c）Parser.tdd 部分内容

# 生成的解析器包路径
package: "org.apache.flink.sql.parser.impl",
# 解析器名称
class: "FlinkSqlParserImpl",
# 引入的依赖类
"org.apache.flink.sql.parser.dql.SqlShowCatalogs"
# 新的关键字
keywords: ["CATALOGS"]
# 新增的语法解析方法
statementParserMethods: ["SqlShowCatalogs()"]
# 包含的扩展语法文件
implementationFiles: ["parserImpls.ftl"]

4）编译模板文件和语法文件

在这里插入图片描述

5）配置扩展的解析器类

withParserFactory(FlinkSqlParserImpl.FACTORY)

2、自定义扩展 Flink 的 Parser 语法

1）定义 SqlNode 类

package org.apache.flink.sql.parser.dql;import org.apache.calcite.sql.SqlCall;
import org.apache.calcite.sql.SqlKind;
import org.apache.calcite.sql.SqlNode;
import org.apache.calcite.sql.SqlOperator;
import org.apache.calcite.sql.SqlSpecialOperator;
import org.apache.calcite.sql.SqlWriter;
import org.apache.calcite.sql.parser.SqlParserPos;import java.util.Collections;
import java.util.List;/** XSHOW CATALOGS sql call. */
public class SqlXShowCatalogs extends SqlCall {public static final SqlSpecialOperator OPERATOR =new SqlSpecialOperator("XSHOW CATALOGS", SqlKind.OTHER);public SqlXShowCatalogs(SqlParserPos pos) {super(pos);}@Overridepublic SqlOperator getOperator() {return OPERATOR;}@Overridepublic List<SqlNode> getOperandList() {return Collections.emptyList();}@Overridepublic void unparse(SqlWriter writer, int leftPrec, int rightPrec) {writer.keyword("XSHOW CATALOGS");}
}

2）修改 includes 目录下的 parserImpls.ftl 文件

/**
* Parse a "XShow Catalogs" metadata query command.
*/
SqlXShowCatalogs SqlXShowCatalogs() :
{
}
{<XSHOW> <CATALOGS>{return new SqlXShowCatalogs(getPos());}
}

3）修改 Parser.tdd 文件，新增-声明拓展的部分

imports:"org.apache.flink.sql.parser.dql.SqlXShowCatalogs"keywords:"XSHOW"statementParserMethods:"SqlXShowCatalogs()"

4）重新编译

 mvn generate-resources

5）执行测试用例

可以看到，自定义 SQL 的报错，由解析失败，变为了校验失败。

import org.apache.flink.table.api.EnvironmentSettings;
import org.apache.flink.table.api.TableEnvironment;public class CustomFlinkSql {public static void main(String[] args) throws Exception {TableEnvironment tEnv = TableEnvironment.create(EnvironmentSettings.newInstance().useBlinkPlanner().build());// 拓展自定义语法 xshow catalogs 前// SQL parse failed. Non-query expression encountered in illegal contexttEnv.executeSql("xshow catalogs").print();// 拓展自定义语法 xshow catalogs 后// SQL validation failed. org.apache.flink.sql.parser.dql.SqlXShowCatalogs cannot be cast to org.apache.calcite.sql.SqlBasicCall}
}

6）查看生成的扩展解析器类

可以看到，在 FlinkSqlParserImpl 中，自定义的解析语法已经生成了。

在这里插入图片描述

3、validate 概述

在向 Flink 中添加完自定义的解析规则后，报错信息如下：

SQL validation failed. org.apache.flink.sql.parser.dql.SqlXShowCatalogs cannot be cast to org.apache.calcite.sql.SqlBasicCall

修改 validate 部分的代码

1）FlinkPlannerImpl#validate

作用：校验 SqlNode ，如果是 show catalogs 语法时直接返回。

在这里插入图片描述

sqlNode.isInstanceOf[SqlXShowCatalogs]

2）SqlToOperationConverter#convert

作用：将校验过的 SqlNode 转换为 Operator。

在这里插入图片描述

else if (validated instanceof SqlXShowCatalogs) {return Optional.of(converter.convertXShowCatalogs((SqlXShowCatalogs) validated));
}

3）SqlToOperationConverter#convertXShowCatalogs

/** Convert SHOW CATALOGS statement. */
private Operation convertXShowCatalogs(SqlXShowCatalogs sqlXShowCatalogs) {return new XShowCatalogsOperation();
}

4）XShowCatalogsOperation

package org.apache.flink.table.operations;public class XShowCatalogsOperation implements ShowOperation {@Overridepublic String asSummaryString() {return "SHOW CATALOGS";}
}

4、执行测试用例

package org.apache.flink.table.examples.java.custom;import org.apache.flink.table.api.EnvironmentSettings;
import org.apache.flink.table.api.TableEnvironment;public class CustomFlinkSql {public static void main(String[] args) throws Exception {TableEnvironment tEnv = TableEnvironment.create(EnvironmentSettings.newInstance().useBlinkPlanner().build());// FlinkSQL原本支持的语法tEnv.executeSql("show catalogs").print();// 自定义语法tEnv.executeSql("xshow catalogs").print();}
}

在这里插入图片描述

5、总结-FlinkSQL 的执行流程

1、对 SQL 进行校验final SqlNode validated = flinkPlanner.validate(sqlNode);2、预校验重写 Insert 语句3、调用 SqlNode.validate() 进行校验1）如果是：ExtendedSqlNode【SqlCreateHiveTable、SqlCreateTable、SqlTableLike】2）如果是：SqlKind.DDL、SqlKind.INSERT 等，无需校验，直接返回 SqlNode3）如果是：SqlRichExplain4）其它：validator.validate(sqlNode)1.校验作用域和表达式：validateScopedExpression(topNode, scope)a）将 SqlNode 进行规范化重写b）如果SQL是【TOP_LEVEL = concat(QUERY, DML, DDL)】，则在父作用域中注册查询c）校验 validateQuery i)validateFeatureii)validateNamespaceiii)validateModalityiv)validateAccessv)validateSnapshotd）如果SQL不是【TOP_LEVEL = concat(QUERY, DML, DDL)】进行类型推导2.获取校验之后的节点类型2、将 SQLNode 转换为 Operationconverter.convertSqlQuery(validated)1）生成逻辑执行计划 RelNodeRelRoot relational = planner.rel(validated);1.对查询进行转换sqlToRelConverter.convertQuery(validatedSqlNode)2）创建 PlannerQueryOperationnew PlannerQueryOperation(relational.project());3、将 Operation 转换为 List<Transformation<?>>
List<Transformation<?>> transformations = planner.translate(Collections.singletonList(modifyOperation));1）对 RelNode 逻辑执行计划进行优化，获取 optimizedRelNodesval optimizedRelNodes = optimize(relNodes)2）将 optimizedRelNodes 转换为 execGraphval execGraph = translateToExecNodeGraph(optimizedRelNodes)3）将 execGraph 转换为 transformations1.使用代码生成技术生成Function,后续可以反射调用val convertFunc = CodeGenUtils.genToInternalConverter(ctx, inputType)

（二开）Flink 修改源码拓展 SQL 语法

1、Flink 扩展 calcite 中的语法解析 1）定义需要的 SqlNode 节点类-以 SqlShowCatalogs 为例 a）类位置 flink/flink-table/flink-sql-parser/src/main/java/org/apache/flink/sql/parser/dql/SqlShowCatalogs.java 核心方法： Override pu…...

编程日记 2023/10/30 0:13:40

java中spi与api的区别

近期看了很多开源组件的源码，发现很多地方地方用到了 spi 的功能，开始思考 spi 与 api 的区别发现 spi 侧重于抽象层次的概念，目前接触到的就是 java 里大量用到了这个，通过定义的接口来抽象通用的功能，然而 api 是不…...

编程日记 2023/10/30 0:12:39

【Android知识笔记】插件化专题（二）

在上一篇专题【Android知识笔记】插件化专题（一）中详细介绍了Android三种插件化方案的实现以及它们的优缺点对比总结等。这一篇中主要来看一下一些插件化开源框架的实现原理，当然市场上的插件化框架有很多，层出不穷，如 DiDi VirtualApk、360 Replugin 等。本人在过去的工…...

编程日记 2023/10/30 0:11:38

赶紧收藏！史上最全IDEA快捷键大全

参考 IntelliJ IDEA 的官网，列举出了IntelliJ IDEA（Windows 版）的所有快捷键。建议收藏，有需要的时候根据关键字来查找！ idea专业版获取 kdocs.cn/l/ctYoaM6evJkl 该快捷键共分 16 类，可以方便的按各类…...

编程日记 2023/10/30 0:10:37

IntelliJ IDEA 把package包展开和压缩

想要展开就把对勾取消，想要压缩就勾上...

编程日记 2023/10/30 0:08:34

Python——自动创建文件夹

文章目录前言一、判断文件夹或者文件是否存在二、创建一级文件夹三、创建多级文件夹四、代码封装前言利用 Python编程语言实现自动创建文件夹，程序以函数形式封装，直接按要求传参即可调用。在python中没有直接针对文件夹的操作方法，可以借助模块os,os.path和shutil来操作…...

编程日记 2023/10/30 0:07:33

2023每日刷题（十三） Leetcode—21.合并两个有序链表直接法实现代码 /*** Definition for singly-linked list.* struct ListNode {* int val;* struct ListNode *next;* };*/ struct ListNode* mergeTwoLists(struct ListNode* list1, struct…...

编程日记 2023/10/30 0:06:33

数据链路层和DNS之间的那些事~

数据链路层，考虑的是两个节点之间的传输。这里面的典型协议也很多，最知名的就是“以太网”。我们本篇主要介绍的就是以太网协议。这个协议规定了数据链路层，也规定了物理层的内容。目录以太网帧格式帧头载荷帧尾 DNS 从输入URL到…...

编程日记 2023/10/30 0:05:32

Spring-声明式事务

声明式事务一、简介1、准备工作2、测试二、声明式事务概念1、编程式事务2、声明式事务3、基于注解的声明式事务1.测试无事务情况2.加入事务①Transactional注解标识的位置②事务属性：只读③事务属性：超时④事务属性：回滚策略⑤事务属性&…...

编程日记 2023/10/30 0:04:31

腾讯云轻量服务器地域选择教程，一篇文章就够了

腾讯云轻量应用服务器地域是指轻量服务器数据中心所在的地理位置，如上海、广州和北京等地域，如何选择地域？腾讯云百科txybk.com建议地域选择遵循就近原则，用户距离轻量服务器地域越近，网络延迟越低，速度就越…...

编程日记 2023/10/30 0:03:30

【斗罗二】王东升级三环，戴华斌挑衅，雨浩单手接鼎订下赌约

【侵权联系删除】【文/郑尔巴金】深度爆料，《绝世唐门》第20集，一场瞩目的战斗即将爆发。王冬，这位一年级的强攻系班长，将与戴华斌进行一场激烈的较量。王冬拥有三大武魂，其中最为人们所熟知的是那光明女神蝶&#x…...

编程日记 2023/10/30 0:02:29

洛谷 B2135：单词替换

【题目来源】https://www.luogu.com.cn/problem/B2135【题目描述】输入一个字符串，以回车结束（字符串长度 ≤200）。该字符串由若干个单词组成，单词之间用一个空格隔开，所有单词区分大小写。现需要将其中的某个单词替换…...

编程日记 2023/10/30 0:01:27

IDEA中application.properties文件中文乱码

现象： 原因： 项目编码格式与IDEA编码格式不一致导致的解决办法： 在File->Settings->Editor->File Encodings选项中，将Global Encoding,Project Encoding,Default encoding for properties files这三个选项置为一致&a…...

编程日记 2023/10/29 23:59:26

Rust 模块系统

文章目录模块系统crate包cargo 创建库库的使用模块系统 Rust的{模块系统|the module system}，包括： * 包（Packages）： Cargo 的一个功能，它允许你构建、测试和分享 crate。 * Crates ：一个模…...

编程日记 2023/10/29 23:58:25

面向服务架构-架构师（六十四）

SOA概述和发展、参考架构、协议和规范、标准和原则、设计模式、构件和实施。 SOA概述和发展服务指系统对外提供的功能，SOA是一种应用框架。微服务去掉了ESB企业服务总线，SOA集中式，SOA和微服务的区别： 微服务更加精细。服务…...

编程日记 2023/10/29 23:56:22

Linux之系统编程

1.yum 1.yum list可以出现所有可下载的程序辅助grep进行查找 2.yum install可以下载并安装 3.yum remove可以卸载程序不同的商业操作系统内核都是一样的，主要是配套社区不一样。开源组织，各大公司，既得利益者。同上基础软件源可以保证…...

编程日记 2023/10/29 23:55:21

信道数据传输速率、信号传播速度——参考《天勤计算机网络》

一、缘起题目二、解析三、总结信道数据传输速率和信号传播速度是两个不同的概念。 3.1 信道数据传输速率（Channel Data Transfer Rate） 指的是在通信系统中，通过信道传输的数据量，通常以比特率（bits per second…...

编程日记 2023/10/29 23:54:20

微信小程序vue+uniapp旅游景点门票预订系统名胜风景推荐系统

与此同时越来越多的旅游公司建立了自己的基于微信小程序的名胜风景推荐平台，管理员通过网站可以添加用户、景点分类、景点信息、在线预订、最新推荐，用户可以对景点信息进行在线预订，以及开展电子商务等。互联网的世界里蕴藏无限生机&#xf…...

编程日记 2023/10/29 23:53:19

每日一题之二分查找（一）

每日一题之二分查找（一） 1.题目（搜索插入位置） 给定一个排序数组和一个目标值，在数组中找到目标值，并返回其索引。如果目标值不存在于数组中，返回它将会被按顺序插入的位置。请必须使用时间…...

编程日记 2023/10/29 23:52:18

Redisson的看门狗策略——保障Redis数据安全与稳定的机制

前言自定义redis分布式锁无法自动续期，比如，一个锁设置了1分钟超时释放，如果拿到这个锁的线程在一分钟内没有执行完毕，那么这个锁就会被其他线程拿到，可能会导致严重的线上问题，在秒杀场景下，…...

编程日记 2023/10/29 23:50:17

visual studio 2022更改主题为深色

visual studio 2022更改主题为深色点击visual studio 上方的工具-> 选项在选项窗口中，选择环境 -> 常规 ，将其中的颜色主题改成深色点击确定，更改完成...

编程新知 2025/11/7 21:03:59

理解 MCP 工作流：使用 Ollama 和 LangChain 构建本地 MCP 客户端

🌟 什么是 MCP？ 模型控制协议 (MCP) 是一种创新的协议，旨在无缝连接 AI 模型与应用程序。 MCP 是一个开源协议，它标准化了我们的 LLM 应用程序连接所需工具和数据源并与之协作的方式。可以把它想象成你的 AI 模型和想要使用它…...

编程新知 2025/11/7 21:08:24

【网络安全产品大调研系列】2. 体验漏洞扫描

前言 2023 年漏洞扫描服务市场规模预计为 3.06（十亿美元）。漏洞扫描服务市场行业预计将从 2024 年的 3.48（十亿美元）增长到 2032 年的 9.54（十亿美元）。预测期内漏洞扫描服务市场 CAGR（增长率&…...

编程新知 2025/11/7 21:08:29

跨链模式：多链互操作架构与性能扩展方案

跨链模式：多链互操作架构与性能扩展方案 ——构建下一代区块链互联网的技术基石一、跨链架构的核心范式演进 1. 分层协议栈：模块化解耦设计现代跨链系统采用分层协议栈实现灵活扩展（H2Cross架构）： 适配层&#xf…...

编程新知 2025/11/7 18:25:33

vue3 定时器-定义全局方法 vue+ts

1.创建ts文件路径：src/utils/timer.ts 完整代码： import { onUnmounted } from vuetype TimerCallback (...args: any[]) > voidexport function useGlobalTimer() {const timers: Map<number, NodeJS.Timeout> new Map()// 创建定时器con…...

编程新知 2025/8/9 0:31:20