当前位置：首页 > news >正文

【数据结构与算法】Z算法（扩展KMP）（C++和Python写法）

news 2026/2/9 2:57:45

Z算法（扩展KMP）

文章目录

Z算法（扩展KMP）
- 朴素求法
- 线性求法
- 力扣类型题
- - 变种题：[3303. 第一个几乎相等子字符串的下标](https://leetcode.cn/problems/find-the-occurrence-of-first-almost-equal-substring/)

所谓Z算法，就是求一个字符串中，每个后缀子串和主串的前缀匹配字符数的数组，其也成为Z数组

eg：主串为aaaab(首位总为0，因为包含首位即本体，无意义)

aaaab aaab -> 3
aaaab aab -> 2
aaaab ab -> 1
aaaab b -> 0
结果集[0, 3, 2, 1,0]

朴素求法

时间复杂度为O(n^2)，暴力获取Z数组。

每次都从头匹配，如果符合往后++，不符合则返回，下一次又从头匹配。

vector<int> z_function_trivial_simple(string s)
{int n = (int)s.length();vector<int> z(n);for (int i = 1; i < n; ++i){while (i + z[i] < n && s[z[i]] == s[i + z[i]])++z[i];}return z;
}

线性求法

我们使用一个滑动窗口[l,r]，这个滑动窗口总是往右移动，我们可以称之为Z_box

这个z_box具有特性：s[l, r] = s[0, r-l]（s为字符串，l和r总是从0开始）

我们再次复习一下z数组的含义：z[i]表示从s[i]开始直到末尾的子字符串和s整个字符串匹配的前缀和

问题一：如何获取这个滑动窗口？

由于滑动窗口（z_box）总是向右移动，所以我们要用z数组及i来辅助获取。

具体方法为：当i+z[i] -1 > r时，修改l和r的位置，是l = i , r = i + z[i] - 1

原因：1. 我们希望滑动窗口会比需要匹配的数字更靠后，或者说能够包含未来匹配的位置，并且滑动窗口总是往右的。

i这里代表新窗口的起始位，z[i]代表匹配的长度， -1 是因为z[i]的数字里包含i的位置。

换句话说，所谓新的z_box就是更往右的匹配上的子串前缀。这么说可能比较抽象，请以下图例辅助理解：

问题二：这个滑动窗口的具体作用？

这个滑动窗口只在i ∈[l, r]时发生作用。

我们以上图例作为一个例子，作为讲解：

此时 i = 5 ，5包含在[4,6]中，而且刚好是中间
因为 s[0,2] == s[4,6] ，那么z[5] 可以直接参考z[1]获取

== > 即z[i] = z[i - l]
但这只是上图的可能性，因为上图中z[i-l] == 1 这个值小于r - i + 1 -> 6- 5 + 1 -> 2，我们已经知道了最多只能匹配到这里

但是！还有一种可能，就是z[i-1] == (r - i + 1)，这种情况我们无法预测r后面是否可以继续匹配，那么我就需要从r的后一位开始匹配。而这种匹配方式则回到了原始的匹配中，不再进行讲解，但是这种情况我们依然可以省略已经处于滑动窗口中的匹配。

下面代码展示（如果还不理解：可以用这个网站模拟：演示Z函数）

C++ 代码

vector<int> z_function(string s)
{		vector<int> z(s.size(), 0);int l = 0, r = 0;for (int i = 1; i < s.size(); i++){if (i <= r && z[i - l] < r - i + 1){z[i] = z[i - l];}else {z[i] = max(0, r - i + 1);// 从头开始暴力求解while (i + z[i] < s.size() && s[z[i]] == s[i + z[i]])++z[i];}if (i + z[i] - 1 > r){l = i, r = i + z[i] - 1;}// 可以打印进行看看cout << "i: "<< i << ", z[i]: "<< z[i] << ", [l, r]: ["<< l <<", " << r<<"]"<<endl;}return z;
}

Python代码

def getZArray(self, s : str) -> List[int]:# z[i] 为从i开始能和主串从头匹配的字符总数z = [0] * len(s)l, r = 0, 0for i in range(1, len(s)):# 当i在窗口内# 如果z[i-l] < (r-i+1)，说明z[i-l]能匹配的字符数已经可知，直接获取# 否则，有可能超出这个数字，需要从末尾继续暴力寻找if i <= r:  # i在窗口内z[i] = min(z[i - l], r - i + 1)while i + z[i] < len(s) and s[z[i]] == s[i + z[i]]:  # 暴力匹配剩余部分z[i] += 1if i + z[i] - 1 > r:  # 更新窗口边界l, r = i, i + z[i] - 1return z

力扣类型题

变种题：3303. 第一个几乎相等子字符串的下标

这道题在Z算法的基础上，变形为前缀+后缀的组合，详情可以看这篇题解，写得很好，我不班门弄斧了。贴上我的代码。

C++

class Solution {
public:int minStartingIndex(string s, string pattern) {int m = pattern.size(), n = s.size();string combine = pattern + s;reverse(pattern.begin(), pattern.end());reverse(s.begin(), s.end());string combinervs = pattern + s;vector<int> pre = getZArray(combine);			// pre_l = z[m+l]vector<int> suf = getZArray(combinervs);		// suf_r = z[m+(n-r-1)]for (int l = 0, r = m - 1; r < n; l++, r++){if (pre[m + l] + suf[m + (n - r - 1)] + 1 >= m)return l;}return -1;}private:vector<int> getZArray(string& s){vector<int> z(s.size(), 0);int l = 0, r = 0;for (int i = 1; i < s.size(); i++){if (i <= r && z[i - l] < r - i + 1){z[i] = z[i - l];}else {z[i] = max(0, r - i + 1);while (i + z[i] < s.size() && s[z[i]] == s[i + z[i]])++z[i];}if (i + z[i] - 1 > r){l = i, r = i + z[i] - 1;}}return z;}
};

Python

from typing import Listclass Solution:def getZArray(self, s: str) -> List[int]:# z[i] 是从索引 i 开始的子串与主串前缀匹配的长度z = [0] * len(s)l, r = 0, 0for i in range(1, len(s)):if i <= r:  # i在窗口内z[i] = min(z[i - l], r - i + 1)while i + z[i] < len(s) and s[z[i]] == s[i + z[i]]:  # 暴力匹配剩余部分z[i] += 1if i + z[i] - 1 > r:  # 更新窗口边界l, r = i, i + z[i] - 1return zdef minStartingIndex(self, s: str, pattern: str) -> int:m, n = len(pattern), len(s)# 生成前缀和后缀Z数组combined = pattern + sreversed_combined = pattern[::-1] + s[::-1]pre = self.getZArray(combined)suf = self.getZArray(reversed_combined)# 检查匹配位置for l in range(n - m + 1):r = l + m - 1if pre[m + l] + suf[m + (n - r - 1)] + 1 >= m:return lreturn -1

参考：

[1] Z函数（扩展KMP）

[2] 3303 第一个几乎相等子字符串的下标——题解

【数据结构与算法】Z算法（扩展KMP）（C++和Python写法）

Z算法（扩展KMP） 文章目录 Z算法（扩展KMP）朴素求法线性求法力扣类型题变种题：[3303. 第一个几乎相等子字符串的下标](https://leetcode.cn/problems/find-the-occurrence-of-first-almost-equal-substring/) 所谓Z算法&…...

编程日记 2024/9/30 5:03:37

免费语音转文字软件全览：开启高效记录新时代

在当今快节奏的信息时代，高效地处理和记录信息变得至关重要。语音转文字技术的出现，为我们带来了极大的便利，今天，就让我们一同探讨这些语音转文字免费的软件的使用方法。 1.365在线转文字链接直达：https://www.pdf…...

编程日记 2024/9/30 5:02:36

PHP“===”的意义

在PHP中， 运算符被称为“恒等比较运算符”（Identical Comparison Operator），它用于比较两个变量的值和类型是否完全相同。这个运算符与双等号 （等值比较运算符）不同，后者在比较时会对两边的值进…...

编程日记 2024/9/30 5:01:35

Tomcat架构解析

Tomcat: 是基于JAVA语言的轻量级应用服务器，是一款完全开源免费的Servlet服务器实现。 1. 总体设计 socket: 其实就是操作系统提供给程序员操作“网络协议栈”的接口，你能通过socket的接口，来控制协议，实现网络通信，达…...

编程日记 2024/9/30 5:00:34

如何在 Kubernetes 上部署和配置开源数据集成平台 Airbyte？

在 Kubernetes 上部署和配置 Airbyte 是一个复杂但非常有价值的过程，特别是对于需要强大数据集成和数据处理能力的企业或团队。Airbyte 是一个开源的数据集成平台，允许用户从各种来源提取数据并加载到目标存储中。其强大的插件系统支持多种数据源与目标&…...

编程日记 2024/9/30 4:59:33

信息技术与商业变革：机遇与挑战

信息技术与商业变革：机遇与挑战目录引言信息技术推动商业变革的主要因素数字化转型的加速客户需求的个性化创新技术的应用信息技术在企业中的应用场景供应链管理的智能化营销与客户关系管理财务与资源管理的自动化远程工作和协作信息技术带来的挑战网络安全…...

编程日记 2024/9/30 4:55:30

JavaWeb之过滤器

1. 过滤器的概念过滤器是Java Servlet规范中定义的组件，用于在请求到达Servlet之前或响应返回客户端之前，对请求或响应进行拦截和处理。过滤器可以实现以下功能： 日志记录：记录请求的详细信息，如URI、参数、时间等。…...

编程日记 2024/9/30 4:54:30

学习笔记

bin log/redo log/undo log MySQL日志主要包括查询日志、慢查询日志、事务日志、错误日志、二进制日志等。其中比较重要的是 bin log（二进制日志）和 redo log（重做日志）和 undo log（回滚日志）。慢SQL查询&…...

编程日记 2024/9/30 4:53:28

Flask-1

文章目录 Flask准备创建flask项目flask加载项目配置的二种方式路由的基本定义接收任意路由参数接收限定类型参数自定义路由参数转换器终端运行Flask项目http的请求与响应flask的生命周期请求获取请求中各项数据获取请求URL参数获取请求体获取请求头相关信息响应响应html文本…...

编程日记 2024/9/30 4:52:28

pve 直通硬盘

qm set <vm_id> –<disk_type>[n] /dev/disk/by-id/- b r a n d − brand- brand−model_$serial_number <vm_id> : 为创建虚拟机时指定的VM ID。 <disk_type>[n]： 导入后的磁盘的总线类型及其编号，总线类型可以选择IDE、SATA…...

编程日记 2024/9/30 4:51:27

NLP_情感分类_机器学习（w2v）方案

文章目录项目背景数据清洗导包导入数据切分评论及标签Word2Vec构造w2v 数据切分模型训练查看结果同类型项目项目背景项目的目的，是为了对情感评论数据集进行预测打标。在训练之前，需要对数据进行数据清洗环节，前面已对数据进行清洗&…...

编程日记 2024/9/30 4:50:26

240929-CGAN条件生成对抗网络

240929-CGAN条件生成对抗网络前面我们学习了GAN（240925-GAN生成对抗网络-CSDN博客）和DCGAN（240929-DCGAN生成漫画头像-CSDN博客），接下来继续来看CGAN（Conditional GAN）条件生成对抗网络。流…...

编程日记 2024/9/30 4:49:25

springboot第74集：设计模式

解析核心线程数与CPU核数相同：避免线程过多导致的上下文切换，提高CPU利用率。无界队列：适合任务量大且任务执行时间短的场景，避免因队列满而拒绝任务。 IO密集型任务场景描述适用于执行大量IO操作的任务，如文件读写…...

编程日记 2024/9/30 4:48:23

数字化采购管理革新：全过程数字化采购管理平台的架构与实施

摘要：在数字化转型的浪潮中，采购管理正逐步迈向全流程的数字化。本文将详细解析全过程数字化采购管理平台的技术架构和实施策略，探讨如何通过Spring Cloud、Spring Boot2、Mybatis等先进技术和服务框架，实现从供应商管理到采购招投…...

编程日记 2024/9/30 4:47:23

Webpack 特性探讨：CDN、分包、Tree Shaking 与热更新

文章目录前言包准备CDN 集成代码分包Tree Shaking原理实现条件：解决 treeShaking 无效方案：示例代码： 热更新（HMR） 前言 Webpack 作为现代前端开发中的核心构建工具，提供了丰富的特性来帮助开发者优化和打…...

编程日记 2024/9/30 4:45:21

Robot Operating System——一组三维空间中的位姿（位置和方向）

大纲应用场景1. 机器人导航场景描述具体应用 2. 运动规划场景描述具体应用 3. 物体识别和跟踪场景描述具体应用 4. 环境建模场景描述具体应用 5. 仿真环境场景描述具体应用定义字段解释案例 geometry_msgs::msg::PoseArray 是 ROS 2 中的一个消息类型，用于表示一…...

编程日记 2024/9/30 4:43:19

mycat读写分离中间件

5、部署Mycat读写分离中间件服务 5.1安装Mycat服务将Mycat服务的二进制软件包Mycat-server-1.6-RELEASE-20161028204710-linux.tar.gz上传到Mycat虚拟机的/root目录下，并将软件包解压到/use/local目录中 5.2赋予解压后的mycat目录权限 5.3向/etc/profile系统变量…...

编程日记 2024/9/30 4:42:18

Growthly Quest 增长工具：助力 Web3 项目实现数据驱动的增长

作者：Stella L (stellafootprint.network) 在瞬息万变的 Web3 领域，众多项目在用户吸引、参与和留存方面遭遇重重难关。Footprint Analytics 推出 Growthly，作为应对这些挑战的全方位解决方案，其中创新性的 Quest（任务…...

编程日记 2024/9/30 4:41:17

Pytorch 学习手册

零相关资料官方网址官方网址下的API搜索网站一定义深度学习框架是用于设计、训练和部署深度学习模型的软件工具包。这些框架提供了一系列预定义的组件，如神经网络层（卷积层、全连接层等）、损失函数、优化器以及数据处理工具&#xf…...

编程日记 2024/9/30 4:39:15

第十一章【前端】调用接口（11.1）——Vite 环境变量

第十一章【前端】调用接口 11.1 Vite 环境变量参考：https://cn.vitejs.dev/guide/env-and-mode.html Vite 在一个特殊的 import.meta.env 对象上暴露环境变量。为了防止意外地将一些环境变量泄漏到客户端，只有以 VITE_ 为前缀的变量才会暴露给经过 …...

编程日记 2024/9/30 4:38:13

基于大模型的 UI 自动化系统

基于大模型的 UI 自动化系统下面是一个完整的 Python 系统，利用大模型实现智能 UI 自动化，结合计算机视觉和自然语言处理技术，实现"看屏操作"的能力。系统架构设计 #mermaid-svg-2gn2GRvh5WCP2ktF {font-family:"trebuchet ms",verdana,arial,sans-…...

编程新知 2025/10/22 11:16:20

WordPress插件：AI多语言写作与智能配图、免费AI模型、SEO文章生成

厌倦手动写WordPress文章？AI自动生成，效率提升10倍！ 支持多语言、自动配图、定时发布，让内容创作更轻松！ AI内容生成 → 不想每天写文章？AI一键生成高质量内容！多语言支持 → 跨境电商必备&am…...

编程新知 2026/1/30 17:24:20

开放MySQL白名单可以通过iptables-save命令确认对应客户端ip是否可以访问MySQL服务： test: # iptables-save | grep 3306 -A mp_srv_whitelist -s 172.16.14.102/32 -p tcp -m tcp --dport 3306 -j ACCEPT -A mp_srv_whitelist -s 172.16.4.16/32 -p tcp -m tcp -…...

编程新知 2025/8/25 19:12:45

【Oracle】分区表

个人主页：Guiat 归属专栏：Oracle 文章目录 1. 分区表基础概述1.1 分区表的概念与优势1.2 分区类型概览1.3 分区表的工作原理 2. 范围分区 (RANGE Partitioning)2.1 基础范围分区2.1.1 按日期范围分区2.1.2 按数值范围分区 2.2 间隔分区 (INTERVAL Partit…...

编程新知 2026/1/20 21:59:36

华硕a豆14 Air香氛版，美学与科技的馨香融合

在快节奏的现代生活中，我们渴望一个能激发创想、愉悦感官的工作与生活伙伴，它不仅是冰冷的科技工具，更能触动我们内心深处的细腻情感。正是在这样的期许下，华硕a豆14 Air香氛版翩然而至，它以一种前所未有的方式&#x…...

编程新知 2026/1/29 14:27:00

C++使用 new 来创建动态数组

问题： 不能使用变量定义数组大小原因： 这是因为数组在内存中是连续存储的，编译器需要在编译阶段就确定数组的大小，以便正确地分配内存空间。如果允许使用变量来定义数组的大小，那么编译器就无法在编译时确定数组的大…...

编程新知 2026/2/2 18:33:19

Java编程之桥接模式

定义桥接模式（Bridge Pattern）属于结构型设计模式，它的核心意图是将抽象部分与实现部分分离，使它们可以独立地变化。这种模式通过组合关系来替代继承关系，从而降低了抽象和实现这两个可变维度之间的耦合度。用例子…...

编程新知 2026/1/23 10:28:48

苹果AI眼镜：从“工具”到“社交姿态”的范式革命——重新定义AI交互入口的未来机会

在2025年的AI硬件浪潮中，苹果AI眼镜（Apple Glasses）正在引发一场关于“人机交互形态”的深度思考。它并非简单地替代AirPods或Apple Watch，而是开辟了一个全新的、日常可接受的AI入口。其核心价值不在于功能的堆叠，而在于如何通过形态设计打破社交壁垒，成为用户“全天佩戴…...

编程新知 2025/12/22 12:09:15

深度学习之模型压缩三驾马车：模型剪枝、模型量化、知识蒸馏

一、引言在深度学习中，我们训练出的神经网络往往非常庞大（比如像 ResNet、YOLOv8、Vision Transformer），虽然精度很高，但“太重”了，运行起来很慢，占用内存大，不适合部署到手机、摄…...

编程新知 2025/9/24 3:56:34

nnUNet V2修改网络——暴力替换网络为UNet++

更换前，要用nnUNet V2跑通所用数据集，证明nnUNet V2、数据集、运行环境等没有问题阅读nnU-Net V2 的 U-Net结构，初步了解要修改的网络，知己知彼，修改起来才能游刃有余。 U-Net存在两个局限，一是网络的最佳深度因应用场景而异，这取决于任务的难度和可用于训练的标注数…...

编程新知 2026/2/7 10:22:16

【数据结构与算法】Z算法（扩展KMP）（C++和Python写法）

免费语音转文字软件全览：开启高效记录新时代

PHP“===”的意义

Tomcat架构解析

如何在 Kubernetes 上部署和配置开源数据集成平台 Airbyte？

信息技术与商业变革：机遇与挑战

JavaWeb之过滤器

学习笔记

Flask-1

pve 直通硬盘

NLP_情感分类_机器学习（w2v）方案

240929-CGAN条件生成对抗网络

springboot第74集：设计模式

数字化采购管理革新：全过程数字化采购管理平台的架构与实施

Webpack 特性探讨：CDN、分包、Tree Shaking 与热更新

Robot Operating System——一组三维空间中的位姿（位置和方向）

mycat读写分离中间件

Growthly Quest 增长工具：助力 Web3 项目实现数据驱动的增长

Pytorch 学习手册

第十一章【前端】调用接口（11.1）——Vite 环境变量

基于大模型的 UI 自动化系统

WordPress插件：AI多语言写作与智能配图、免费AI模型、SEO文章生成

MySQL用户和授权

【Oracle】分区表

华硕a豆14 Air香氛版，美学与科技的馨香融合

C++使用 new 来创建动态数组

Java编程之桥接模式

苹果AI眼镜：从“工具”到“社交姿态”的范式革命——重新定义AI交互入口的未来机会

深度学习之模型压缩三驾马车：模型剪枝、模型量化、知识蒸馏

nnUNet V2修改网络——暴力替换网络为UNet++

【数据结构与算法】Z算法（扩展KMP）（C++和Python写法）

Z算法（扩展KMP）

文章目录

朴素求法

线性求法

力扣类型题

变种题：3303. 第一个几乎相等子字符串的下标

相关文章：