这篇文章来说说如何简单理解KMP,BM算法。之前看过一些文章说,KMP算法很难理解。 可我并不觉得。 我反而觉得它容易理解。平时我们写java代码的时候, 判断一个字符串是否存在包含另一个字符串都是直接 string.contains(str), 可你知道它是实现的么? 不妨亲自去看看它是如何实现的?

看此文章之前,严重建议先去看看阮一峰老师写的的KMP算法文章。如果那篇文章都可以完全理解了,那么就没必要看这篇文章浪费时间了。

字符串匹配在平时开发中还是很常用的,只不过我们一般都是调用jdk提供的方法直接使用。

下面以这个为例子,来描述KMP算法原理。

在字符串"BBCABCDABABCDABCDABDE",判断里面是否包含另一个字符串"ABCDABD"?

在字符串匹配算法中,我们除了可以逐一匹配之外,别无它法。包括KMP,BM算法也是逐一匹配的,只不过是KMP,BM算法用了很多讨巧的方式提高了匹配效率。

首先先来看看暴力匹配,暴力匹配就是逐一匹配,当匹配失败后,子串往后移动一个字符。主串中的“B”,与子串中的“A”不匹配,子串往后移动一个字符

然后继续往后匹配。匹配失败就往后一个字符。

当子串中的前6个字符匹配上了,但最后一个字符匹配失败,子串又只能往后移动一个字符,有点可惜。

一直到主串中的“ABCDABD”与子串完全匹配,那么就匹配成功。

这种暴力匹配的效率太低了,因为不管你前面匹配成功时,到后面字符一旦匹配失败时,那么前面匹配的成功的,又得重新匹配一遍。

下面我们来假设一种情况(当然这种假设情况是错误的),只要匹配失败,那么移动我们匹配上的字符数量,看看会发现什么情况?

举例:子串“ABCDABD”,当匹配到“ABCD”完成时,匹配“A”失败,那么后面移动4个字符。匹配失败,移动一个字符子串匹配到后一个“D”时,匹配失败,移动6个字符

根据前面的假设,字符所有的字符都匹配过了,那么就可以移动6个字符。根据上图移动6个字符之后的效果

匹配失败,移动一个字符。

当子串匹配到后一个“D”时,又匹配失败,往后移动6个字符。最后错过想要匹配的字符串。

这种假设,有个很明显的问题,就是尺度大了。错过了我们想要匹配的字符串。

其实我们思路已经对了一半了,这时应该反思错在哪了?

以这种情况为例, 按照假设就是直接移动6个字符。但是子串前缀“AB”是在后面有出现的。

正确的话,是应该移动到后面的AB那里,继续开始匹配。根据上图匹配失败之后,正确的移动字符数

是的。KMP算法就是可以按照这种思路理解的。一般情况下,当已经匹配过子串中,前面的子串中的字符串在后续没有出现,那么就可以移动所有匹配过的字符串。

如果前面的子串中的字符串在后续中有出现,那么移动到字符出现到后续出现那里。

再举个例子。

ABCDABDCA 这个子串中,当匹配到第2个“A”失败时,子串前面匹配过的“ABCD”的前缀和前中缀,都不会在中后缀,后缀中出现,那么就可以直接移动4个字符。

ABCDABDCA 这个子串中,当匹配到第2个“D”失败时,子串前面匹配过的“ABCDAB”的前缀,“AB”是后缀中出现了,那么就只能移到“AB”那里了,即 6 - 2 = 4,移动4个字符。

简单理解就是: 先把匹配过的字符直接移动过去,看看会不会错过什么。 如果不会,那么就确认移动。 如果会,那么回退到目标位置。

根据KMP算法的部分匹配值,可以计算出目标位置的值。

由于阮一峰老师关于部分匹配值和KMP算法总结太棒了,所以有关部分匹配值的概念,怎么计算,就参考阮一峰老师文章吧。

最后来说说,java里面, String.contains方法实现。

java中的String.contains也是使用暴力匹配的方式,没有使用KMP,BM之类的算法。

至于为什么,这个就发散一下,留给自己思考吧。

最后的最后,既然提到了KMP算法,另一个也很常用,且一般情况下效率更高的BM算法,就留给你自己看吧,兴许下一篇文章就是说说BM算法。

以上, good night.

字符串匹配算法Java_如何简单理解字符串匹配算法?相关推荐

  1. java 字符串 数字个数_Java简单统计字符串中汉字,英文字母及数字数量的方法...

    本文实例讲述了Java简单统计字符串中汉字,英文字母及数字数量的方法.分享给大家供大家参考,具体如下: package org.zhy.demo.algorithm; /** * 有一个字符串,其中包 ...

  2. 【Redis系列2】Redis字符串对象之SDS(简单动态字符串)实现原理分析

    Redis字符串对象之SDS实现原理分析 前言 字符串对象 为什么Redis的字符串对象是二进制安全的 SDS空间分配策略 空间预分配 惰性空间释放 SDS和C语言字符串区别 SDS的底层存储对象 d ...

  3. 括号匹配算法 java_使用栈实现括号匹配算法-java

    题目:检验符号是否匹配. '['和']', '('和')'成对出现时字符串合法. 例如"[][]()", "[[([]([])()[])]]"是合法的; &qu ...

  4. c 字符串数组_redis为什么不直接使用C字符串,而要自定义简单动态字符串?

    来源:公众号[编程珠玑] 作者:守望先生 ID:shouwangxiansheng Redis (一个使用ANSI C编写的开源.支持网络.基于内存.可选持久性的键值对存储数据库.)没有直接使用 C ...

  5. 简单理解常量、常量池、运行时常量池和字符串常量池

    1.常量 常量在java中就值的是一般的字面量,比如字符串,整数,浮点数等等数据.简单理解java中什么叫常量 2.常量池,也叫静态常量池或者class文件常量池,说常量池一定要指明是编译器产生的.它 ...

  6. 正则表达式查找字符串_如何简单理解正则表达式?只需1分钟就可以看到她优美的舞姿...

    Hi,大家好,本章节开始将会从零开始和大家用图文的方式,让你从零基础学会正则表达式!有兴趣的小伙伴可以持续关注我,或者在专栏中进行查看自我学习,愿与君携手前行! 本文将要说到的正则表达式?可能初学的你 ...

  7. redis学习 -- 简单动态字符串

    Redis没有使用C语言字符串的形式,通过'\0'作为结尾,而是使用了简单动态字符串(simple dynamic string). 当Redis使用的字符串不需要修改字符串的内容的时候,可以使用C语 ...

  8. Redis内部数据结构详解之简单动态字符串(sds)

    本文所引用的源码全部来自Redis2.8.2版本. Redis中简单动态字符串sds数据结构与API相关文件是:sds.h, sds.c. 转载请注明,本文出自:http://blog.csdn.ne ...

  9. Redis数据结构之简单动态字符串SDS

    Redis的底层数据结构非常多,其中包括SDS.ZipList.SkipList.LinkedList.HashTable.Intset等.如果你对Redis的理解还只停留在get.set的水平的话, ...

最新文章

  1. 服务器温度3d显示,智能问答助手、3D可视化展示,腾讯医典“黑科技”助力科普更有温度...
  2. linux 后台进程
  3. hadoop块的存储方式
  4. 【原创】【专栏】《Linux设备驱动程序》--- LDD3源码目录结构和源码分析经典链接
  5. Caffe 编译安装
  6. 3.4 matlab用for语句实现循环结构
  7. 两种交换排序算法:冒泡排序和快速排序
  8. 浅析Java各种变量线程安全问题
  9. 字符串匹配算法(Trie树)
  10. 八爪鱼 ajax 循环采集,网页数据采集五大循环方式详解 - 八爪鱼采集器
  11. 我为什么从 Google 辞职,开始为自己工作?
  12. 前端打印复选框的打勾时问题求教
  13. 彻底解决pycharm中用matplotlib表格绘制时图表中汉字设置
  14. XML文档类型定义---XML Schema
  15. excel拆分单元格内容_Excel中最神奇的一个快捷键!牛!!
  16. android系统APK签名生成大全
  17. 一种网络用户行为日志自动获取方法
  18. Qcom 8909 sbl1流程
  19. Excel 计算重复项中的唯一值的方法
  20. oracle 10.2.0.1 install for centos 5.9(ins_rdbms.mk问题)

热门文章

  1. DFTug - Architecture Your Test Design
  2. UDP千兆以太网FPGA_verilog实现(五、以太网帧的结构)
  3. 【PC工具】更新最全最好的编程手册管理软件Zeal,arduino学习、python学习编程语法查阅必备工具...
  4. ppwjs之bootstrap表格:String.到表头单元格元素 和 String.到表格单元格元素
  5. 老男孩教育Python 9期第一课练习题答案
  6. 可穿戴计算之父:成都能成为可穿戴技术未来中心
  7. vs code golang插件记录
  8. 如何使用通用Mapper
  9. java 线程的几种状态(转载)
  10. ASP.NET - 演练:创建网页以显示 XML 数据