我又回来了,感jio这几天有点勤啊!!
这一次我带着KMP来了,

文章目录

  • KMP介绍
  • 模板
  • 例题: 子串查找
    • 题目
    • 暴力题解
    • KMP题解
    • 代码实现

KMP介绍

KMP,即 Knuth-Morris-Pratt 字符串查找算法,由Donald Knuth、Vaughan Pratt、James H. Morris三人于1977年联合发表,故取这3人的姓氏命名此算法。

KMP的算法流程如下:
假设字符串S现匹配到位置i,模式串P匹配到位置j:
①若j==-1,或S[i]==P[j],则i++,j++,继续后面的匹配
②若j!=-1且S[i]!=P[j],则i不变,j=next[j]
(这样就意味着当每次失配时,模式串P相对于字符串S向右移动了j-next[j]位)
这样就不用每次从头开始跑了

那么我们来看看next数组是怎么计算的。
①寻找模式串P的最长前缀、后缀
假设字符串S为ABCDAB ABCDABCDABDE,模式串P为ABCDABD

字符串 前缀 后缀 最大公共元素长度
A 0
AB A B 0
ABC A,AB C,BC 0
ABCD A,AB,ABC D,CD,BCD 0
ABCDA A,AB,ABC,ABCD A,DA,CDA,BCDA 1
ABCDAB 2
ABCDABD

字符 A B C D A B D
公共元素长度 0 0 0 0 1 2 0

ABCDAB ABCDABCDABDE
ABCDABD
这时D和空格匹配,
那么P向右移动的位数=已匹配的字符数(6)-上一个字符的最大公共元素长度(B的时候长度为2)=4
当第一位也不匹配的时候,直接向后移动一位。

模板

void kmp () {int len = strlen ( p );for ( int i = 1, j = 0;p[i];i ++ ) {while ( j && p[j] != p[i] )j = nxt[j];nxt[i + 1] = p[j] == p[i] ? ++ j : 0;}int tot = 0;for ( int i = 0, j = 0;s[i];i ++ ) {while ( j && p[j] != s[i] )j = nxt[j];if ( p[j] == s[i] && ++ j == len ) {tot ++;j = nxt[j];}}printf ( "%d", tot );
}

看懂了的话,就来到例题试试吧!

例题: 子串查找

题目

给出两个字符串s和p,其中p为s的子串,求p在s中的出现次数。
必须完全连续匹配,且s,p全部为大写或小写字母

输入格式
第一行为一个字符串,即为s
第二行为一个字符串,即为p
输出格式
输出一个整数,表示p在s中的出现次数。

输入输出样例
输入
zyzyzyz
zyz
输出
2

N<=1000000

暴力题解

暴力很好想,就是一个一个地跑,一旦遇到不匹配的,就从头开始重新跑:
假设字符串S现匹配到位置i,模式串P匹配到位置j。
那么,当S[i]==P[j]的时候,i++,j++,并继续下一次匹配。
若S[i]!=P[j],则i=i-j+1,j=0,即将i移动到此轮匹配的下一位,j置0重新匹配。

代码就不献给诸君了,因为我懒得写

KMP题解

遇到某些题目,例如给多个匹配串和一个模式串,大家千万不要跑n遍next数组,
没有必要因为,next根本没有变。

因为这道题是个模板,看懂了KMP介绍的各位小可爱,就不需要再解释为什么了?

我重点分析一下代码这玩意儿:
nxt[i]的含义:在模式串p中,从0到i-1为止前缀后缀字符最大匹配长度。
第一个for循环就是处理出nxt,因为当我们处理到i时,要找到0~i-1的nxt,
怕麻烦,我们可以把nxt整体往后移1,这样i就对应了nxt[i-1]
注意循环里的while (j=nxt[j])不能写成j=0,举个栗子:
abcdefababacdefababxyz
abacdefabab
ans:2,你如果写成0,wrong ans:1
因为写成零的话当你走到模式串p的倒数第二个字符,即a的时候你没有存下1,
导致最后循环到b的时候nxt没有成为2,反而是0,在s中查找的时候就会错过一个答案开头(关注加粗)

第二个循环就是找个数了,前文提到是将整个p右移x-nxt[i],而我则是写成将p的下标变成nxt[i]
控制s不变,这样就是个相对对应关系了,我们反正是用下标操作,不一定要移动两个字符串
好好理解吧~~
while里的j也不能直接赋值成为0,不然你连样例都过不了,还做什么??
具体原因与上面如出一辙,我不再阐释。。。

一句话就是如果写成j=0,那么那些所有模式串结尾等于模式串开头的数据,基本上你都凉了~~
abcdabcda
abcda
这种类似数据你可能都要少算,因为s有两个模式串共用了一个字符,你就GG了

我知道很多小可爱,看完后。。

也就只有大牛 不有可能,大佬都被我搞蒙了,看来我技术还是不错的~

代码实现

#include <cstdio>
#include <cstring>
#define MAXN 1000005
char s[MAXN], p[MAXN];
int nxt[MAXN];void kmp () {int len = strlen ( p );for ( int i = 1, j = 0;p[i];i ++ ) {while ( j && p[j] != p[i] )j = nxt[j];nxt[i + 1] = p[j] == p[i] ? ++ j : 0;}int tot = 0;for ( int i = 0, j = 0;s[i];i ++ ) {while ( j && p[j] != s[i] )j = nxt[j];if ( p[j] == s[i] && ++ j == len ) {tot ++;j = nxt[j];}}printf ( "%d", tot );
}int main() {scanf ( "%s %s", s, p );kmp ();return 0;
}

那个男人,带着KMP走来了,又一脸懵逼地离开了?

学习KMP (概念 + 模板 + 例题: 子串查找)相关推荐

  1. 学习三分 (概念 + 模板 + 例题:曲线)

    这好像是我第一次尝试写一个新知识入门 而不是习题解 文章目录 三分概念 模板 例题:曲线 题目 题解 代码实现 三分概念 我们都知道,二分是在一个单调函数(即一次函数)上通过每次查找折半的方式,对答案 ...

  2. 树链剖分概念及模板 + 例题 [POJ3237 tree + 软件包管理器]

    文章目录 概念 模板 例题1:软件包管理器 题目 题解 代码实现 例题2:POJ3237 tree 题目 题解 代码实现 概念 树链剖分主要是用于解决以下这两个问题. 1.更改树上点x到点y的最短路径 ...

  3. 【swjtu】数据结构实验4_基于改进KMP算法的子串查找与替换

    实验内容及要求: 从键盘输入主串s以及子串t1和t2.编写程序,将主串s中所有t1子串替换为t2子串,输出替换后得到的串以及t1被替换的次数.要求子串查找采用改进KMP算法. 实验目的:掌握KMP算法 ...

  4. python rfind函数用法_Python语法速查:字符串格式简单处理、子串查找与判断方法?...

    这是一篇python基础知识分享型文章,对学习python感兴趣的朋友们可以仔细看看 字符串常用方法 Python3中,字符串全都用Unicode形式,所以省去了很多以前各种转换与声明的麻烦.字符串属 ...

  5. LibreOJ #103. 子串查找

    二次联通门 : LibreOJ #103. 子串查找 /*LibreOJ #103. 子串查找kmp*/ #include <cstdlib> #include <cstring&g ...

  6. C/C++学习之路: 模板和异常

    C/C++学习之路: 模板和异常 目录 模板 类型转换 异常 1. 模板 1. 模板概述 c++提供了函数模板(function template),函数模板实际上是建立一个通用函数,其函数类型和形参 ...

  7. KMP算法模板与解析

    全部数据结构.算法及应用课内模板请点击:https://blog.csdn.net/weixin_44077863/article/details/101691360 将KMP算法,就要先讲讲它是用来 ...

  8. [转载] 五、字符串类的实现及子串查找算法

    参考链接: C++ 查找和替换子字符串 一.字符串类的创建 问题提出:C语言不支持真正意义上的字符串 C语言使用字符数组("\0"结束)和一组函数实现字符串操作 C语言不支持自定义 ...

  9. 如何更好地学习新概念英语

    如何更好地学习新概念英语 作者:未知 文章来源:沪江英语   在全世界的英语学习者的心目中,<新概念英语>可谓是一部"宝典"级的教材,如今在中国,学习<新概念英语 ...

最新文章

  1. 打造Worktile敏捷开发管理工具的思与惑
  2. 浅谈pytorch 模型 .pt, .pth, .pkl的区别及模型保存方式 pth中的路径加载使用
  3. 大型网站系统架构演化之路
  4. 博客搬到CSDN了,以后就老实的呆在这儿吧~~
  5. javamac系统通过pid获取进程名称_线上环境 Linux 系统调用追踪
  6. 为什么连续申请的两个 int 型变量的地址差值为 12 而不是 4 ?
  7. oracle 拼接_老品牌三明49寸液晶拼接屏多少钱支持定制
  8. WindowProc和DefWindowProc的区别
  9. C#基础|面向对象之多态
  10. python自动化运维之路~DAY1
  11. 2008年全国计算机等级考试须知及参考资料
  12. 旁枝末梢(我好像稍微理解了mvc和mvvm)
  13. ubuntu 设置静态路由_Linux route 配置静态路由(转载)
  14. springboot全局异常处理_SpringMVC全局异常处理
  15. 登录GITHUB:Open your two-factor authenticator (TOTP) app or browser extension to view your authenticat
  16. 首屏加载,与less的初始化css
  17. HTML+CSS 简单的顶部导航栏菜单制作
  18. 自身知识浅薄,开发积累问题
  19. MySQL基础之查询语句
  20. 新型机房建设的优点有哪些?

热门文章

  1. 干货|吴恩达Coursera课程教你学习神经网络二!
  2. 计算机网络就业范围分析,计算机网络技术专业就业前景怎么样「就业形势分析」...
  3. rk3399性能_AIIA AI公布首轮评估结果:瑞芯微RK3399数据抢眼
  4. hash算法_到底什么是Hash?Hash算法的原理和实际应用讲解
  5. shell oracle查询数组,shell 脚本 ---数组
  6. 归纳推理测试没做完_朋友买了1斤紫菜,2年还没吃完,我教他这样做,2个月就吃完了...
  7. 学计算机与学英语作文,初二英语作文(关于计算机与学习)
  8. ajax上传文件 获取失败,Ajax上传文件/照片时报错TypeError :Illegal invocation的解决方法...
  9. c语言整数四则运算表达式的输出格式控制,Educoder CC++基本输入输出
  10. 缩减oracle日志,[20180829]减少日志生成量.txt