当前位置: 首页 > news >正文

C语言详解KMP算法

如果给你一个字符串 和 该字符串的一个子字符串 你能否快速找出该子字符串的所在位置

我猜 这里会有一群杠精 说可以找到

真的吗 那下面这个字符串你可以一眼看出来吗

你能找出来吗 如果能 算你眼神好 如果不能 那就看看接下来我怎么做

你有想到暴力求解法吗?

——来自百度百科

BF算法,即暴力(Brute Force)算法,是普通的模式匹配算法,BF算法的思想就是将目标串S的第一个字符与模式串T 的第一个字符进行匹配,若相等,则继续比较S的第二个字符和 T的第二个字符;若不相等,则比较S的第二个字符和 T的第一个字符,依次比较下去,直到得出最后的匹配结果。BF算法是一种蛮力算法

——个人理解

暴力求解法——就是将主串和字串的对应字符挨个去比较

相同就比较下一个

不相同 将主串回退到刚开始字符的下一个位置 再将子串回退到第一个字符的位置

如此反复直到遍历完整个主串 时间复杂度很高O(m*n)

m主串长度 n子串长度

那么这个暴力求解(Brute Force)怎样实现呢?

int BF(const char* s, const char* arr, int pos)
{assert(s && arr);//判断两个地址为不为空int lens = strlen(s);int lena = strlen(arr);int i = 0, j = 0;while (i < lens && j < lena)//只要没到尾部 就一直循环{if (s[i] == arr[j]){i++;j++;}else{i = i - j + 1;// 因为要退回 主字符串刚开始匹配的下一个字符串 -j 是为了找到刚开始的字符 +1是找到下一个字符j = 0;//子字符串退回到开头}}if (j >= lena){return i - j;//这里和上面理解相似}else{return -1;}
}int main()
{char* s = "ababcabcdabcde";//用字符串常量存储字符串 字符串常量不能被改变char* arr = "abcd";printf("%d\n", BF(s, arr, 0));return 0;
}

虽然 暴力求解可以找到 但是每次匹配失败 主串都要回退到刚开始 字符的下一个位置

这就导致了时间复杂的上升 如果主字符串特别长 子字符串也很长 那么时间复杂度会很大 计算机有可能运算不出来

如何优化呢?那就要讲到这篇文章的主角KMP算法 它很好的解决了主串字符不回退的问题

KMP算法是一种改进的字符串匹配算法,由D.E.Knuth,J.H.Morris和V.R.Pratt提出的,因此人们称它为克努特—莫 里斯—普拉特操作(简称KMP算法)。KMP算法的核心是利用匹配失败后的信息,尽量减少模式串与主串的匹配次 数以达到快速匹配的目的。具体实现就是通过一个next()函数实现,函数本身包含了模式串的局部匹配信息。KMP算 法的时间复杂度O(m+n) [1] 。 来自-------百度百科

区别:KMP 和 BF 唯一不一样的地方在,我主串的 i 并不会回退,并且 j 也不会移动到 0 号位置

首先 举例子看看为什么主串不回退

假设目前匹配失败 主串退回到1号位置也是没有必要的 因为b和子串0位置的a 也不一样(从暴力求解算法角度来看)

既然主串i不回退 那么就只能让j回退了 那么j应回退到哪个位置呢?

此时匹配失败,我们不进行回退i 因为在这个地方匹配失败,说明i的前面和j的前面,是有一部分相同的

,不然两个下标不可能走到这里来 是不是这个理

看到这个图 我们会发现 如果j回退到2下标 i不回退 这就是最好的结果

那么问题就是j咋知道回退到2号位置?

那就需要一个数组去告诉它 该回退到哪一个下标

也就是next数组 —— KMP的精髓就是next数组:也就是用next[j] = k;来表示,不同的j来对应一个k值,这个k值就是你将来要移动j 去哪个下标

那么k值是怎样求的呢?

1,规则:找到匹配成功部分的两个相等的真子串(不包含本身),一个以下表0字符开始,另一个以j-1下标字符结尾

2,不管什么数据next[0]=-1;next[1]=0;在这里 我们以下标来开始,而说到的第几个第几个是从1开始;

这里有两道练习题来练习怎样求next数组

练习1:”ababcabcdabcde” -1 0 0 1 2 0 1 2 0 0 1 2 0 0 练习2:”abcabcabcabcdabcde” -1 0 0 0 1 2 3 4 5 6 7 8 9 0 1 2 3 0

到这里大家对如何求next数组应该问题不大了,接下来的问题就是,已知next[i] = k;怎么求next[i+1] = ?

后面的没求完 你可以自己去求一下

如果我们能够通过 next[i]的值,通过一系列转换得到 next[i+1]得值,那么我们就能够实现这部分。 那该怎么做呢? 首先假设: next[i] = k 成立,那么,就有这个式子成立: P0...Pk-1 = Px...Pi-1;得到: P0...Pk-1 = Pi-k..Pi-1; 到这一步:我们再假设如果 Pk = Pi;我们可以得到 P0...Pk = Pi-k..Pi;那这个就是 next[i+1] = k+1;

k 就是以0开始的字符向后找k-1个字符 以第k-1个字符结尾为前一个字符串

i就是以j-1结尾的字符向前找k-1个字符 以第i-k个字符开始 为后一个字符串

将两个字符比较确定i对应的next[i]的值

当p[i] == p[k] 此时next[i+1] = k+1 next[5] = 2

当p[k] != p[i]

此时p[i] != p[k] 那么k要继续回退到0下标 也就是新的k_new = next[k];

进一步回退后p[0] == p[i] 那么就符合next[i+1] = k_new+1;

也就是next[6] = 0 + 1 = 1

void GetNext(int* next, const char* arr)
{int len = strlen(arr);next[0] = -1;next[1] = 0;int i = 2;int k = 0;while (i < len){if (k == -1 || arr[k] == arr[i - 1]){next[i] = k + 1;i++;k++;}else{k = next[k];}}}int kmp(const char* s, const char* arr, int pos)
{assert(s && arr);int len1 = strlen(s);int len2 = strlen(arr);int i = pos;int j = 0;int* next = (int*)malloc(sizeof(int) * len2);//next数组的大小和 arr(待寻找的数组大小相同)assert(next);GetNext(next, arr);while (i < len1 && j < len2){if ((j == -1) || (s[i] == arr[j])){ i++;j++;}else{j = next[j];}}free(next);next = NULL;if (j >= len2){return i - j;}else{return -1;}
}int main()
{char *s = "ababcabcdabcde";char *arr = "abcd";printf("%d ", kmp(s, arr, 0));return 0;
}

以上代码如有不懂 留言私信 ~

相关文章:

C语言详解KMP算法

如果给你一个字符串 和 该字符串的一个子字符串 你能否快速找出该子字符串的所在位置我猜 这里会有一群杠精 说可以找到 真的吗 那下面这个字符串你可以一眼看出来吗你能找出来吗 如果能 算你眼神好 如果不能 那就看看接下来我怎么做你有想到暴力求解法吗&#xff1f;——来自百…...

redis在window上安装与自启动

需求&#xff1a; 客户window服务器使用redis&#xff0c;需要配置成在window服务中&#xff0c;并且可以随着电脑自启动服务。 下载 https://github.com/tporadowski/redis/releases打开上面的下载地址&#xff0c;这里我们下载zip压缩版本。 解压到待安装目录下&#xff…...

字符串匹配【BF、KMP算法】

文章目录:star:BF算法代码实现BF的改进思路:star:KMP算法&#x1f6a9;next数组&#x1f6a9;代码实现优化next数组最终代码⭐️BF算法 BF算法&#xff0c;即暴力(Brute Force)算法&#xff0c;是普通的模式匹配算法&#xff0c;BF算法的思想就是将主串S的第一个字符与模式串P…...

Leetcode.1616 分割两个字符串得到回文串

题目链接 Leetcode.1616 分割两个字符串得到回文串 Rating &#xff1a; 1868 题目描述 给你两个字符串 a和 b&#xff0c;它们长度相同。请你选择一个下标&#xff0c;将两个字符串都在 相同的下标 分割开。由 a可以得到两个字符串&#xff1a; aprefix和 asuffix&#xff0c…...

剑指 Offer II 033. 变位词组

题目链接 剑指 Offer II 033. 变位词组 mid 题目描述 给定一个字符串数组 strs&#xff0c;将 变位词 组合在一起。 可以按任意顺序返回结果列表。 注意&#xff1a;若两个字符串中每个字符出现的次数都相同&#xff0c;则称它们互为变位词。 示例 1: 输入: strs [“eat”,…...

spring-cloud-sentinel ---流控算法---review

计数器算法 计数器算法&#xff0c;限定每个固定时间能处理的请求总数&#xff0c;例如1分钟100&#xff0c;如果在第一个一分钟&#xff0c;总共请求60次&#xff0c;接着第二个一分钟&#xff0c;counter又会从0 开始技术&#xff0c;如果在1.5分钟的时候&#xff0c;达到了…...

1.浅析NIO 多路复用器selector

一&#xff1a;IO基本介绍 Java共支持3种网络编程IO模式&#xff1a;BIO&#xff0c;NIO&#xff0c;AIO 0.Java对BIO、NIO、AIO的支持&#xff1a; Java BIO &#xff1a; 同步并阻塞&#xff0c;服务器实现模式为一个连接一个线程&#xff0c;即客户端有连接请求时服务器端…...

Day920.结构化日志业务审计日志 -SpringBoot与K8s云原生微服务实践

结构化日志&业务审计日志 Hi&#xff0c;我是阿昌&#xff0c;今天学习记录的是关于结构化日志&业务审计日志的内容。 1、什么是结构化日志 结构化日志&#xff08;Structured Logging&#xff09;是一种将日志信息组织为结构化数据的技术。 传统的日志通常是一些文…...

前端代码复用学习笔记:整洁架构与清晰架构

基础代码的复用往往比较简单&#xff0c;但是业务代码的复用通常是困难的&#xff0c;如果没有特殊的手段去治理项目会逐渐发展为难以维护的巨石应用&#xff0c;按照维基百科记载&#xff0c;代码的复用形式主要有三种&#xff0c;程序库&#xff0c;应用框架&#xff0c;设计…...

【python刷题】leecode官方提示“->“,“:“这些符号是什么意思?什么是Type Hints?

作者&#xff1a;20岁爱吃必胜客&#xff08;坤制作人&#xff09;&#xff0c;近十年开发经验, 跨域学习者&#xff0c;目前于海外某世界知名高校就读计算机相关专业。荣誉&#xff1a;阿里云博客专家认证、腾讯开发者社区优质创作者&#xff0c;在CTF省赛校赛多次取得好成绩。…...

【华为OD机试真题2023 JAVA】最佳对手

华为OD机试真题,2023年度机试题库全覆盖,刷题指南点这里 最佳对手 知识点排序DFS搜索回溯 时间限制:1s 空间限制:256MB 限定语言:不限 题目描述: 游戏里面,队伍通过匹配实力相近的对手进行对战。 但是如果匹配的队伍实例相差太大,对于双方游戏体验都不会太好。 给定n个…...

css实现文字大小自适应

在页面编写中经常会碰到页面自适应的问题&#xff0c;也就是页面内部的元素会随着窗口的放大缩小而放大缩小&#xff0c;box可以通过calc 百分比的形式做到页面自适应&#xff0c;但是box内的字体却无法做到这点&#xff0c;往往box自适应大小了&#xff0c;内部的字体还是原来…...

【Redis】搭建哨兵集群

目录 集群结构 准备实例和配置 启动 测试 集群结构 这里我们搭建一个三节点形成的Sentinel集群&#xff0c;来监管之前的Redis主从集群。如图&#xff1a; 三个sentinel实例信息如下&#xff1a; 节点IPPORTs1192.168.150.10127001s2192.168.150.10127002s3192.168.150.…...

CTFHub | .htaccess

0x00 前言 CTFHub 专注网络安全、信息安全、白帽子技术的在线学习&#xff0c;实训平台。提供优质的赛事及学习服务&#xff0c;拥有完善的题目环境及配套 writeup &#xff0c;降低 CTF 学习入门门槛&#xff0c;快速帮助选手成长&#xff0c;跟随主流比赛潮流。 0x01 题目描述…...

微机原理 || 8253 芯片 (详细讲解 + 经典例题)

一点点看&#xff01;一定可以看懂&#xff01;考试没有问题的&#xff01;加油&#x1f4aa; 前面知识写的详细&#xff0c;看不懂可以先看典例&#xff0c;回头来梳理就明白了【典例就是常考的题】 目录 Part 1: 芯片知识总结 &#xff08;一&#xff09;8253 芯片特点 …...

python Django高级操作-分页-定义CVS-发送邮件

分页 分页是指在web页面有大量数据需要显示&#xff0c;为了阅读方便在每个页页中只显示部分数据。优点: 1.方便阅读2.减少数据提取量&#xff0c;减轻服务器压力。Paginator对像 负责分页数据整体的管理对象的构造方法Paginator属性 Paginator方法 Paginator异常exception pag…...

React 用一个简单案例体验一遍 React-dom React-router React-redux 全家桶

一、准备工作 本文略长&#xff0c;建议耐心读完&#xff0c;每一节的内容与上一节的内容存在关联&#xff0c;最好跟着案例过一遍&#xff0c;加深记忆。 1.1 创建项目 第一步&#xff0c;执行下面的命令来创建一个 React 项目。 npx create-react-app react-example cd rea…...

9. C#面向对象基础

一、C# 类 在 C# 中&#xff0c;类是引用类型的。类由成员属性和成员方法构成。我们可以动态创建类的实例&#xff08;instance&#xff09;&#xff0c;这个实例也被称为对象&#xff08;object&#xff09;&#xff0c;我们可以通过类和对象来设计程序。 1、类的定义 类的定…...

【MIT 6.S081】Lab2: system calls

本Lab包括两个简单系统调用的实现&#xff0c;进一步熟悉系统调用接口。 笔者用时约1.5h 概述 根据文档说明&#xff0c;当我们添加一个系统调用时&#xff0c;比如第一个任务是添加一个trace&#xff0c;需要进行以下操作&#xff1a; 首先将系统调用的原型添加到user/user…...

设计模式之单例模式~

设计模式包含很多&#xff0c;但与面试相关的设计模式是单例模式&#xff0c;单例模式的写法有好几种&#xff0c;我们主要学习这三种—饿汉式单例&#xff0c;懒汉式单例、登记式单例,这篇文章我们主要学习饿汉式单例 单例模式&#xff1a; 满足要点&#xff1a; 私有构造 …...

像素剧本圣殿惊艳案例:故障艺术标题下生成的赛博朋克短剧完整场次

像素剧本圣殿惊艳案例&#xff1a;故障艺术标题下生成的赛博朋克短剧完整场次 1. 像素剧本圣殿创作工具介绍 Pixel Script Temple&#xff08;像素剧本圣殿&#xff09;是一款基于Qwen2.5-14B-Instruct深度微调的专业剧本创作工具。这个独特的创作平台将先进的AI推理能力与复…...

TimeGAN实战:用对抗网络生成高保真时间序列数据

1. TimeGAN&#xff1a;当时间序列遇上生成对抗网络 第一次听说TimeGAN这个概念时&#xff0c;我正在处理一批金融交易数据。客户要求我们开发一个高频交易预测模型&#xff0c;但原始数据涉及商业机密&#xff0c;能拿到的样本量只有正常需求的1/10。当时试过传统的数据增强方…...

**发散创新:基于Python的虚拟原型快速构建实践与实战代码解析**

发散创新&#xff1a;基于Python的虚拟原型快速构建实践与实战代码解析 在现代软件开发流程中&#xff0c;虚拟原型&#xff08;Virtual Prototype&#xff09; 已成为产品设计前期验证的核心手段。它不仅加速了需求确认过程&#xff0c;还显著降低了后期返工成本。本文将深入…...

深入解析SCB_AIRCR:STM32中断与复位控制的关键寄存器

1. SCB_AIRCR寄存器&#xff1a;STM32的中枢神经 第一次接触STM32的中断系统时&#xff0c;我对着密密麻麻的寄存器列表发懵&#xff0c;直到发现了SCB_AIRCR这个"控制中枢"。它就像城市交通指挥中心&#xff0c;决定着所有中断车辆的通行规则。这个位于0xE000ED00地…...

电子设计竞赛必备:RC、运放、TTL信号处理电路实战指南(附避坑技巧)

电子设计竞赛信号处理电路实战&#xff1a;从RC滤波到TTL脉冲的进阶技巧 第一次参加电子设计竞赛时&#xff0c;我在信号处理环节浪费了整整两天时间——原本清晰的方波经过电路后变得面目全非&#xff0c;放大后的信号带着令人头疼的振荡&#xff0c;而评委要求的脉冲宽度总是…...

xi-mac性能优化指南:7个技巧让你的编辑器运行如飞

xi-mac性能优化指南&#xff1a;7个技巧让你的编辑器运行如飞 【免费下载链接】xi-mac The xi-editor mac frontend. 项目地址: https://gitcode.com/gh_mirrors/xim/xi-mac xi-mac是一款基于Rust后端和Cocoa前端的现代文本编辑器&#xff0c;以其卓越的性能表现而闻名。…...

PyTorch 2.8镜像部署案例:跨境电商平台商品图→营销短视频自动生成

PyTorch 2.8镜像部署案例&#xff1a;跨境电商平台商品图→营销短视频自动生成 1. 项目背景与价值 跨境电商平台每天需要为成千上万的商品制作营销短视频&#xff0c;传统方式面临三大痛点&#xff1a; 人力成本高&#xff1a;专业视频制作团队单条视频成本约300-500元生产效…...

Unity物理游戏开发:如何用FixedTimestep优化不同设备的性能表现

Unity物理游戏开发&#xff1a;动态调整FixedTimestep实现跨设备性能优化 移动端游戏开发者常面临一个核心矛盾&#xff1a;物理模拟精度与设备性能的平衡。当你的游戏在高端设备上流畅运行&#xff0c;却在低端机型出现卡顿时&#xff0c;问题往往出在Fixed Timestep的静态配置…...

自动驾驶小白必看:航向角、偏航角、前轮转角到底有什么区别?

自动驾驶入门&#xff1a;航向角、偏航角与前轮转角的本质差异与应用解析 刚接触自动驾驶技术时&#xff0c;最让人困惑的莫过于那些描述车辆方向的专业术语——航向角、偏航角、前轮转角&#xff0c;它们看起来相似却又各有所指。理解这些概念不仅是掌握车辆控制的基础&#…...

GPU算力高效利用:Pixel Language Portal在单卡多实例部署中的资源隔离与负载均衡教程

GPU算力高效利用&#xff1a;Pixel Language Portal在单卡多实例部署中的资源隔离与负载均衡教程 1. 引言&#xff1a;为什么需要单卡多实例部署 在AI应用开发中&#xff0c;GPU资源往往是稀缺且昂贵的。Pixel Language Portal作为一款基于Tencent Hunyuan-MT-7B的高端翻译工…...