CSDN|开玩笑呢？学习KMP算法能改变自我认知？

本文插图
作者 | 落阳学编程责编 | 王晓曼出品 | CSDN 博客前言近日被朋友问到了字符串匹配算法，让我想起了大二上学期在一次校级编程竞赛中我碰到同样的问题时，为自己写出了暴力匹配算法而沾沾自喜的经历。现在想来，着实有点羞愧，于是埋头去学习了一下 KMP 算法，为了让自己不至于那么快忘记，也希望小伙伴们能从我的理解中收获一点自己的感悟！文章带有精心雕琢的动画以便理解。分析我们首先来分析一下暴力算法，为鲜花的诞生献上绿叶！以下文中统一将需要被匹配的字符串（长的那段）称为待匹配串，把用来匹配的字符串（短的那段）称为模式串。暴力匹配算法的思路很简单，就是每一次都首先将待匹配串和模式串的首字母对齐，然后比对是否相同，若相同则继续比对两个串的下一个位置，如果不相同的话就将模式串向右移动一位，然后再重新开始从头匹配，就像下面这样：【CSDN|开玩笑呢？学习KMP算法能改变自我认知？ | 原力计划】
本文插图
从上面的动画我们可以直观的看出来，下面的模式串在匹配失败之后都只会移动一格，傻里傻气的，这就导致它的时间复杂度是M?N M*NM?N ，其中M是模式串的长度， N是待匹配串的长度。对于这个时间复杂度，我不满意！它太傻了，不符合我聪明睿智的气质！那就来分析一下为何它这么傻。我们可以看到，在第一次匹配失败的时候，我们肯定希望它向右移动至少两格，因为模式串的第一格和第三格都为a ，既然第三格已经匹配成功了，那么把第一格对上第三格匹配的位置，那么无疑肯定也是可以成功的，我们的算法本该知道并且利用这一点的！但是它没有，它太傻了。嗯，这么一说，好像是感觉应该是要把它向着动态规划的方向改（即利用已有信息为下一步提供便利）。PS：字符串问题百分之八十以上都可以使用动态规划思想达到较低的时间复杂度。核心问题我们大都听过一句老话：人啊，贵在有自知之明。同时我们肯定也听别人说过：人只有深刻的认识了自己，才能找对位置，迅速地向目标前进！这两句话用在KMP算法中再合适不过了！ KMP算法的核心便在于，模式串对自己的自我认知！想一想，我们人对自己的认知是如何的：男， 19岁，阳光帅气聪明机智，这些自我认知都存放在我的脑袋里面。那么，模式串对自己的认知应该存放在哪呢？对，就是next数组里面！字符串没有大脑，所以它需要额外的空间来存储它对自己的认知并借此作出高效准确的判断。那么字符串对自己的认知是怎样的呢？其实很容易理解，就是知道自己身上哪些地方是相同的，这样的话在匹配失败之后就能迅速找准下次开始的点。这里是不是有点模糊了？图来！
本文插图
以上就是KMP算法的动画，如果觉得动画稍微有点快的话可以多观看几次，在这个动画里我还没有放出next数组的部分，只是用拟人化的手法展现出来。希望大家能够理解，为什么第一次匹配失败可以直接移动两格。是因为模式串中第三格的a ，它知道在第一格有与自己相同的字符，并且把这个信息告诉下一格的字符，让它在匹配失败之后直接把第一格的a移动到它的那个位置上去。来看看模式串与其对应的next自我认识数组吧。
本文插图
不要去在意next数组的第一个为什么是-1 ，这是为了代码写的方便，暂且就给它当成0 。在动画中，当一个字符发出“直接移动”的语句的时候，其实是告诉后一个字符，如果你匹配失败了的话，就直接移动，同时后一个字符对应的next数组值为0 ，当后一个字符匹配失败了，就移动模式串的长度-这个匹配失败的字符对应的next值个长度。从第四个字符（i=3）起，它们都在不断告诉后面一个字符：“将i=0移动到i=3的位置” ，这句话对于i=4的字符来说，是移动4-1格，对于i=5的字符来说，是移动5-2格，对于i=6的字符来说，是移动6-3格：后面那个减数恰好就是这个字符对应的next数组的值! 因为模式串足够了解自己，所以它能够在匹配失败的时候不用回退，不用每次只移动一格，而是跟随着待匹配串一起移动。待匹配字符串的指针从未回退过，以线性的速度向前一步步越进。最终：KMP算法的时间复杂度是M+N M+NM+N 这里我们不禁发出了感叹！原来认识自己真的这么重要啊！接下来是求出给定模式串的next数组： Python3代码奉上：def get_next_lst(ss: str) -> list: length = len(ss) next_lst = [0 for _ in range(length)] next_lst[0] = -1 i = 0 j = -1 while i < length - 1: if j == -1 or ss[i] == ss[j]: i += 1 j += 1 next_lst[i] = j else: j = next_lst[j] return next_lst这段代码最难理解的就是j=next_lst[j]这句话，其实这句话也是动态规划的一个思想，看我为你剖析一下。

CSDN|开玩笑呢？学习KMP算法能改变自我认知？ | 原力计划

推荐阅读

2022我的新年愿望创意句子文案 2022我的新年愿望创意句子文案怎么写

亚太日报■自称不能给伴侣过生日难过，杜特尔特怒批隔离令下有人喝酒斗鸡

|进球网: 梅西中止续约谈判是为表达不满巴托梅乌面临提前卸任

主动|果然“炒股不如买基金”！指数跌超40%，股基竟然翻倍赚！前3季度、近3年和5年最赚钱基金50强来了！

消化疾病|肝脏是否健康？看手脚4处变化，若你全占，或肝脏已经“垮”了

阜新华图|“走出去”坚持“走出去”

衣服有机油味怎么办

那些双胞胎甚至三胞胎、多胞胎一样的茶,让我眼花缭乱

加速器|多部门密集部署政策　消费复苏“加速器”启动

2021年中国人口总数有几亿？

诈骗|假称出租房屋代为配置家电，骗走业主数十万用于还债，1人已落网

快了棒棒糖|展现疫情笼罩下的美国，美国时代周刊又一封面

cpa有什么用(cpa的报考条件)

在西交利物浦大学用啥查重软件自查比较好

#科技数码迷#11夺冠荣耀V30Pro垫底，本周最畅销单品分析，iPhone

中年今年6月全省快递业务量同比增长46.90%

陨石|陨石坠落现场！一颗流星划破长空，北欧三国夜空亮如白昼

#cnBeta#微软取消原定于3月在墨尔本举行的IoT in Action大会，受疫情影响

【车家号】本田又一中型SUV亮相，搭3.5升V6发动机+四驱系统！，对标汉兰达

油爆虾