当前位置: 首页 > article >正文

SQLMesh Typed Macros:让SQL宏更强大、更安全、更易维护

在SQL开发中,宏(Macros)是一种强大的工具,可以封装重复逻辑,提高代码复用性。然而,传统的SQL宏往往缺乏类型安全,容易导致运行时错误,且难以维护。SQLMesh
引入了 Typed Macros(类型化宏),结合Python的类型提示(Type
Hints),让SQL宏更强大、更安全、更易维护。本文将深入探讨Typed Macros的核心优势、使用方法及最佳实践。

在这里插入图片描述

1. 什么是Typed Macros?

Typed Macros 是SQLMesh提供的一种类型化宏系统,它允许开发者使用Python的类型提示(如strintList[int]等)来定义宏的输入和输出类型。相比传统宏,Typed Macros具有以下优势:

提高可读性:类型提示让宏的意图更清晰,便于团队协作和后期维护。
✅ ​​减少样板代码​​:无需手动转换数据类型,直接使用Python原生类型。
✅ ​​增强IDE支持​​:IDE(如VS Code、PyCharm)能提供更好的代码补全和文档提示。
✅ ​​更安全的执行​​:类型检查能在开发阶段捕获潜在错误,减少运行时问题。

2. 如何定义Typed Macros?

Typed Macros 使用Python的@macro装饰器,并结合类型提示定义输入和输出类型。例如,一个简单的字符串重复宏:

from sqlmesh import macro@macro()
def repeat_string(evaluator, text: str, count: int) -> str:return text * count
  • text: str 表示第一个参数必须是字符串。
  • count: int 表示第二个参数必须是整数。
  • -> str 表示返回值必须是字符串。

使用示例

SELECT @repeat_string('SQLMesh ', 3) AS repeated_string FROM some_table;

预期输出'SQLMesh SQLMesh SQLMesh'

3. 为什么需要显式转换SQL输出?

虽然Typed Macros可以指定Python类型,但SQLMesh最终生成的SQL必须是合法的SQL语法。例如,上面的repeat_string宏返回的是Python字符串,但SQL需要的是带引号的字符串字面量。如果不转换,生成的SQL会是无效的:

SELECT SQLMesh SQLMesh SQLMesh AS repeated_string FROM some_table;  -- 错误!缺少引号

解决方案:使用exp.Literal.string()显式转换:

from sqlmesh import macro
import sqlglot.expressions as exp@macro()
def repeat_string(evaluator, text: str, count: int) -> str:return exp.Literal.string(text * count)  # 返回带引号的SQL字符串

正确生成的SQL

SELECT 'SQLMesh SQLMesh SQLMesh' AS repeated_string FROM some_table;  -- 正确

4. 支持的类型系统

SQLMesh支持多种Python类型,并能与SQLGlot(SQL抽象语法树)结合使用:

Python类型说明
str字符串字面量
int / float数字
bool布尔值
datetime.datetime / datetime.date日期时间
List[T]列表(如List[int]
Tuple[T]元组(如Tuple[str, int]
exp.TableSQL表节点
exp.ColumnSQL列节点
exp.LiteralSQL字面量
exp.IdentifierSQL标识符

高级用法

  • 可以使用SQL类型直接返回SQL字符串(不推荐,除非必要)。
  • 可以使用exp.Selectexp.Subquery等复杂SQL节点类型,实现更灵活的宏逻辑。

示例:返回一个带时间戳的子查询

from sqlmesh import macro
import sqlglot.expressions as exp
from datetime import datetime@macro()
def stamped(evaluator, query: exp.Select) -> exp.Subquery:return query.select(exp.Literal.string(str(datetime.now())).as_("stamp")).subquery()

使用方式

SELECT * FROM @stamped('SELECT a, b, c')

生成的SQL

SELECT *, '2024-01-01 12:00:00' AS stamp FROM (SELECT a, b, c) AS subquery

5. 类型检查与错误处理

Typed Macros 默认会尝试自动转换输入类型,但如果转换失败,会记录警告而非报错。如果需要更严格的检查,可以使用assert

@macro()
def my_macro(evaluator, table: exp.Table) -> exp.Column:assert isinstance(table, exp.Table), "Input must be a SQL table!"table.set("catalog", "dev")return table
  • 如果传入非表对象(如字符串),会抛出AssertionError
  • 这种方式比默认的警告更严格,适合关键业务逻辑。

6. 高级用法:泛型与复杂逻辑

Typed Macros 支持Python的typing模块,可以实现泛型宏。例如,计算整数列表的和:

from typing import List
from sqlmesh import macro@macro()
def sum_integers(evaluator, numbers: List[int]) -> int:return sum(numbers)

使用方式

SELECT @sum_integers([1, 2, 3, 4, 5]) AS total FROM some_table;

生成的SQL

SELECT 15 AS total FROM some_table;  -- 假设宏被正确替换

7. 最佳实践

  1. 优先使用类型提示:即使宏逻辑简单,也建议加上类型提示,提高可读性。
  2. 显式转换SQL输出:避免直接返回Python字符串,使用exp.Literal.string()确保生成合法SQL。
  3. 关键逻辑使用assert:对输入类型做严格检查,避免运行时错误。
  4. 结合SQLGlot表达式:利用exp.Tableexp.Column等类型,实现更灵活的宏逻辑。

8. 结论

Typed Macros 是SQLMesh的一大创新,它结合Python的类型系统,让SQL宏更安全、更易维护。通过类型提示、显式SQL转换和严格的输入检查,开发者可以:

  • 减少错误,提高代码质量
  • 增强IDE支持,提升开发效率
  • 构建更复杂的SQL逻辑,同时保持代码清晰

相关文章:

SQLMesh Typed Macros:让SQL宏更强大、更安全、更易维护

在SQL开发中,宏(Macros)是一种强大的工具,可以封装重复逻辑,提高代码复用性。然而,传统的SQL宏往往缺乏类型安全,容易导致运行时错误,且难以维护。SQLMesh 引入了 Typed Macros&…...

DeepSpeed-Ulysses:支持极长序列 Transformer 模型训练的系统优化方法

DeepSpeed-Ulysses:支持极长序列 Transformer 模型训练的系统优化方法 flyfish 名字 Ulysses “Ulysses” 和 “奥德修斯(Odysseus)” 指的是同一人物,“Ulysses” 是 “Odysseus” 的拉丁化版本 《尤利西斯》(詹姆…...

Docker 使用镜像[SpringBoot之Docker实战系列] - 第537篇

历史文章(文章累计530) 《国内最全的Spring Boot系列之一》 《国内最全的Spring Boot系列之二》 《国内最全的Spring Boot系列之三》 《国内最全的Spring Boot系列之四》 《国内最全的Spring Boot系列之五》 《国内最全的Spring Boot系列之六》 《…...

解锁MCP:AI大模型的万能工具箱

摘要:MCP(Model Context Protocol,模型上下文协议)是由Anthropic开源发布的一项技术,旨在作为AI大模型与外部数据和工具之间沟通的“通用语言”。它通过标准化协议,让大模型能够自动调用外部工具完成任务&a…...

Error in beforeDestroy hook: “Error: [ElementForm]unpected width “

使用 element 的 form 时候报错: vue.runtime.esm.js:3065 Error: [ElementForm]unpected width at VueComponent.getLabelWidthIndex (element-ui.common.js:23268:1) at VueComponent.deregisterLabelWidth (element-ui.common.js:23281:1) at Vue…...

vscode包含工程文件路径

在 VSCode 中配置 includePath 以自动识别并包含上层目录及其所有子文件夹,需结合通配符和相对/绝对路径实现。以下是具体操作步骤及原理说明: 1. 使用通配符 ** 递归包含所有子目录 在 c_cpp_properties.json 的 includePath 中,${workspac…...

私有知识库 Coco AI 实战(七):摄入本地 PDF 文件

是否有些本地文件要检索?没问题。我们先对 PDF 类的文件进行处理,其他的文件往后稍。 Coco Server Token 创建一个 token 备用。 PDF_Reader 直接写个 python 程序解析 PDF 内容,上传到 Coco Server 就行了。还记得以前都是直接写入 Coco …...

GitLab 18.0 正式发布,15.0 将不再受技术支持,须升级【二】

GitLab 是一个全球知名的一体化 DevOps 平台,很多人都通过私有化部署 GitLab 来进行源代码托管。极狐GitLab 是 GitLab 在中国的发行版,专门为中国程序员服务。可以一键式部署极狐GitLab。 学习极狐GitLab 的相关资料: 极狐GitLab 官网极狐…...

NtfsLookupAttributeByName函数分析之和Scb->AttributeName的关系

第一部分: VOID FindFirstIndexEntry ( IN PIRP_CONTEXT IrpContext, IN PSCB Scb, IN PVOID Value, IN OUT PINDEX_CONTEXT IndexContext ) { 。。。。。。 // // Lookup the attribute record from the Scb. // if (!NtfsLookupAt…...

STM32H7系列USART驱动区别解析 stm32h7xx_hal_usart.c与stm32h7xx_ll_usart.c的区别?

在STM32H7系列中,stm32h7xx_hal_usart.c和stm32h7xx_ll_usart.c是ST提供的两种不同层次的USART驱动程序,主要区别在于设计理念、抽象层次和使用场景: 1. HAL库(Hardware Abstraction Layer) 文件:stm32h7x…...

网络原理 | TCP与UDP协议的区别以及回显服务器的实现

目录 TCP与UDP协议的区别 基于 UDP 协议实现回显服务器 UDP Socket 编程常用 Api UDP 服务器 UDP 客户端 基于 TCP 协议实现回显服务器 TCP Socket 编程常用 Api TCP 服务器 TCP 客户端 TCP 服务端常见的 bug 客户端发送数据后,没有响应 服务器仅支持…...

IP动态伪装开关

IP动态伪装开关 在OpenWrt系统中,IP动态伪装(IP Masquerading)是一种网络地址转换(NAT)技术,用于在私有网络和公共网络之间转换IP地址。它通常用于允许多个设备共享单个公共IP地址访问互联网。以下是关于O…...

【Unity3D】将自动生成的脚本包含到C#工程文件中

我们知道,在用C#开发中,通过vs编辑器新建的脚本,会自动包含到vs工程中,而通过外部创建,比如复制别的工程或代码创建的C#脚本不会包含到vs工程。 在我们的日常开发中,通常会自动创建C#脚本,特别…...

解决leetcode第3509题.最大化交错和为K的子序列乘积

3509.最大化交错和为K的子序列乘积 难度:困难 问题描述: 给你一个整数数组nums和两个整数k与limit,你的任务是找到一个非空的子序列,满足以下条件: 它的交错和等于k。 在乘积不超过limit的前提下,最大…...

【Python 深度学习】1D~3D iou计算

一维iou 二维 import numpy as npdef iou_1d(set_a, set_b):# 获得集合A和B的边界 x1, x2 set_ay1, y2 set_b# 计算交集的上下界low max(x1,y1)high - min(x2, y2)# 计算交集if high - low < 0:inter 0else:inter high - low# 计算并集union (x2 -x1) (y2 - y1) - in…...

java23

1.美化界面 添加背景图片 所以我们添加背景图片要放在后面添加 添加图片边框 绝对路径&#xff1a; 相对(模块)路径&#xff1a; 第一个是绝对路径&#xff0c;第二个是相对路径&#xff0c;但是斜杠的方向不对 总结&#xff1a; 2.图片移动 先实现KeyListener接口&#xf…...

嵌入式工程师常用软件

1、 Git Git 是公司常用的版本管理工具&#xff0c;人人都要会。在线的 git 教程可以参考菜鸟教程&#xff1a; https://www.runoob.com/git/git-tutorial.html 电子书教程请在搜索栏搜索&#xff1a; git Git 教程很多&#xff0c;常用的命令如下&#xff0c;这些命令可…...

LitCTF2025 WEB

星愿信箱 使用的是python&#xff0c;那么大概率是ssti注入 测试{{5*5}} 发现需要包含文字&#xff0c;那么添加文字 可以看到被waf过滤了&#xff0c;直接抓包查看参数上fenjing 可以看到这里是json格式&#xff0c;其实fenjing也是支持json格式的 https://github.com/Marv…...

Redisson WatchDog会一直续期吗?

取决于加锁的方式。 Lock 方法有2种形式&#xff0c;如果指定了leaseTime &#xff08;且不为-1&#xff09;&#xff0c; 不会启用watchDog机制. 如果没有指定leaseTime&#xff0c; 则会启动watchDog机制&#xff0c;且会一直续期&#xff0c;除非线程宕调或者续期失败。 p…...

Linux 下VS Code 的使用

这里以创建helloworld 为例。 Step 0:准备工作&#xff1a; Install Visual Studio Code. Install the C extension for VS Code. You can install the C/C extension by searching for c in the Extensions view (CtrlShiftX). Step 1: 创建工作目录 helloworld&#xff0…...

Android开发namespace奇葩bug

Android开发namespace奇葩bug namespace "com.yibanxxx.yiban"buildFeatures {buildConfig true}namespace 对应你的module的清单下的package...

watchEffect

在处理复杂异步逻辑时&#xff0c;Vue 3 的 watchEffect 相比传统的 watch 具有以下优势&#xff1a; 1. 自动追踪依赖 watchEffect 会自动收集其回调中使用的所有响应式依赖&#xff0c;无需手动指定监听源&#xff1a; import { ref, watchEffect } from vue;const count …...

Qt 布局管理器的层级关系

1、HomeWidget.h头文件&#xff1a; #ifndef HOMEWIDGET_H #define HOMEWIDGET_H#include <QWidget> #include <QPushButton> #include <QVBoxLayout> #include <QHBoxLayout>class HomeWidget : public QWidget {Q_OBJECTpublic:HomeWidget(QWidget …...

Android 之 kotlin 语言学习笔记一

参考官方文档&#xff1a;https://developer.android.google.cn/kotlin/learn?hlzh-cn 1、变量声明 Kotlin 使用两个不同的关键字&#xff08;即 val 和 var&#xff09;来声明变量。 val 用于值从不更改的变量。使用 val 声明的变量无法重新赋值。var 用于值可以更改的变量…...

maven模块化开发

使用方法 将项目安装到本地仓库 mvn install 的作用 运行 mvn install 时&#xff0c;Maven 会执行项目的整个构建生命周期&#xff08;包括 compile、test、package 等阶段&#xff09;&#xff0c;最终将构建的 artifact 安装到本地仓库&#xff08;默认路径为 ~/.m2/repos…...

为什么要使用stream流

总的来说就是 它支持链式调用&#xff0c;方便 不会修改原始数据源&#xff0c;而是生成一个新的流或结果 中间操作不会立即执行&#xff0c;只有在终端操作触发时才会真正执行 注意事项 无状态操作&#xff1a;Stream 操作应该是无状态的&#xff0c;不要依赖外部变量的状…...

语义分割的image

假设图像的尺寸为 3x3&#xff0c;并且是 RGB 图像&#xff08;有 3 个通道&#xff09;。每个通道的像素值范围为 [0, 1]&#xff0c;我们将构造一个 batch_size 2 的图像批次。 Image: tensor([[[[0.1347, 0.4583, 0.7102], # 第一张图像的红色通道[0.1774, 0.0328, 0.308…...

云原生安全之网络IP协议:从基础到实践指南

&#x1f525;「炎码工坊」技术弹药已装填&#xff01; 点击关注 → 解锁工业级干货【工具实测|项目避坑|源码燃烧指南】 一、基础概念 IP协议&#xff08;Internet Protocol&#xff09;是互联网通信的核心协议族之一&#xff0c;负责在设备间传递数据包。其核心特性包括&…...

C++——QT 文件操作类

QFile 概述 QFile是Qt框架中用于文件操作的类&#xff08;位于QtCore模块&#xff09;&#xff0c;继承自 QIODevice&#xff0c;提供文件的读写、状态查询和路径管理功能。它与 QTextStream、QDataStream 配合使用&#xff0c;可简化文本和二进制数据的处理&#xff0c;并具备…...

【排错】kylinLinx环境python读json文件报错UTF-8 BOM

kylin Linux环境python读json文件报错UTF-8 BOM 报错描述&#xff1a; windows环境下,python代码读取json文件正常&#xff0c;但是sftp到linux环境下 报错信息&#xff1a; json.decoder.JSONDecodeError: Unexpected UTF-8 BOM (decode using utf-8-sig): line 1 column …...