作者:翟天保Steven
版权声明:著作权归作者所有,商业转载请联系作者获得授权,非商业转载请注明出处

题目描述:

Levenshtein 距离,又称编辑距离,指的是两个字符串之间,由一个转换成另一个所需的最少编辑操作次数。许可的编辑操作包括将一个字符替换成另一个字符,插入一个字符,删除一个字符。编辑距离的算法是首先由俄国科学家Levenshtein提出的,故又叫Levenshtein Distance。

Ex:

字符串A:abcdefg

字符串B: abcdef

通过增加或是删掉字符”g”的方式达到目的。这两种方案都需要一次操作。把这个操作所需要的次数定义为两个字符串的距离。

要求:

给定任意两个字符串,写出一个算法计算它们的编辑距离。

本题含有多组输入数据。

输入描述:

每组用例一共2行,为输入的两个字符串

输出描述:

每组用例输出一行,代表字符串的距离

示例:

输入:

abcdefg
abcdef
abcde
abcdf
abcde
bcdef

输出:

1
1
2

解题思路:

这道题用动态规划法做,建立二分图,解题函数为Levenshtein,辅助函数为getmin,getmin用来计算三个数值的最小值。

首先获取两个字符串a和b,给其开头创建空格,建立二分图,图的上边数据为0123456,意义是将b字符串操作(删除或添加)n次字符,使其和a字符串一致;左边数据同理。

接下来从(1,1)位置开始动态计算,若a[i]==b[j],表示该位置的最小变换次数同a[i-1][j-1]一致;若a[i]!=b[j],则考虑如下三种情况:

  1. a字符串中删除某字符或者b字符串中插入某字符,即L[i][j] = L[i-1][j] + 1;
  2. a字符串中插入某字符或者b字符串中删除某字符,即L[i][j] = L[i][j-1] + 1;
  3. a[i]替换成b[j]或者b[j]替换成a[i],lev[i][j] = lev[i-1][j-1] + 1。

结合如上四种情况动态计算出二分图中每个位置的数据,L[n-1][m-1]的值就是a和b两个字符串的Levenshtein距离。

测试代码:

#include <iostream>
#include <string>using namespace std;int getmin(int a,int b,int c)
{a=min(a,b);b=min(b,c);return min(a,b);
}int Levenshtein(string a,string b)
{a.insert(0, 1,' ');b.insert(0, 1,' ');int n=a.size();int m=b.size();int k,L[n][m];// 相当于删除字符串a的i个字符,使字符串一致for(int i=0;i<n;++i){L[i][0]=i;}// 相当于删除字符串b的i个字符,使字符串一致for(int i=0;i<m;++i){L[0][i]=i;}// 动态规划建二分表,动态记录最小距离for(int i=1;i<n;++i){for(int j=1;j<m;++j){// 若a和b当前字符一致,则最小距离同i-1和j-1的一致,所以k为0if(a[i]==b[j])k=0;elsek=1;// 若a和b当前字符不一致,有三种可能,取最小数值为当前位置数据L[i][j]=getmin(L[i][j-1]+1, L[i-1][j]+1, L[i-1][j-1]+k);}}return L[n-1][m-1];
}int main()
{string a,b;while(cin>>a>>b){cout<<Levenshtein(a, b)<<endl;}return 0;
}

华为机试HJ52:计算字符串的距离(动态规划)相关推荐

  1. 华为机试HJ1:字符串最后一个单词的长度

    作者:翟天保Steven 版权声明:著作权归作者所有,商业转载请联系作者获得授权,非商业转载请注明出处 题目描述: 计算字符串最后一个单词的长度,单词以空格隔开,字符串长度小于5000. 输入描述: ...

  2. 华为机试HJ30:字符串合并处理

    作者:翟天保Steven 版权声明:著作权归作者所有,商业转载请联系作者获得授权,非商业转载请注明出处 题目描述: 按照指定规则对输入的字符串进行处理. 详细描述: 将输入的两个字符串合并. 对合并后 ...

  3. 华为机试HJ4:字符串分隔

    作者:翟天保Steven 版权声明:著作权归作者所有,商业转载请联系作者获得授权,非商业转载请注明出处 题目描述: •连续输入字符串,请按长度为8拆分每个字符串后输出到新的字符串数组:  •长度不是8 ...

  4. 2014华为机试,计算给定和牌麻将的番数

    一.题目如下 二.题目分析 麻将和牌有两种形式,即: 模式1 :11,11,11,11,11,11,11 模式2: 11,123,123,123,123(全部或者部分123可以被111,1111替代) ...

  5. 华为机试——整理数字字符串

    C_C++_XY_01.整理数字字符串 题目描述: 输入一个包含若干整数的字符串,负数前面带有负号'-',正数不带'+',每个整数都是个位数. 请将此串进行如下整理: 1. 将串中的正负数分离,使得负 ...

  6. 华为机试HJ36:字符串加密

    作者:翟天保Steven 版权声明:著作权归作者所有,商业转载请联系作者获得授权,非商业转载请注明出处 题目描述: 有一种技巧可以对数据进行加密,它使用一个单词作为它的密匙.下面是它的工作原理:首先, ...

  7. 华为机试HJ29: 字符串加解密

    作者:翟天保Steven 版权声明:著作权归作者所有,商业转载请联系作者获得授权,非商业转载请注明出处 题目描述: 1.对输入的字符串进行加解密,并输出. 2.加密方法为: 当内容是英文字母时则用该英 ...

  8. 华为机试HJ26:字符串排序

    作者:翟天保Steven 版权声明:著作权归作者所有,商业转载请联系作者获得授权,非商业转载请注明出处 题目描述: 编写一个程序,将输入字符串中的字符按如下规则排序. 规则 1 :英文字母从 A 到 ...

  9. 华为机试HJ14:字符串排序

    作者:翟天保Steven 版权声明:著作权归作者所有,商业转载请联系作者获得授权,非商业转载请注明出处 题目描述: 输入x个字符串,然后根据字符串的内容进行排序 输入描述: 第一行的输入n代表接下来要 ...

最新文章

  1. Django中Mysql数据库的使用
  2. npm install对本地工程文件造成了哪些修改
  3. 并发–执行程序和Spring集成
  4. spad 探测器_从光到光子—“单光子”探测器
  5. 乱码解决方案SecureCRT中文乱码解决方案
  6. 小项目也可以学习到很多东西
  7. (六)Java垃圾回收机制(附带代码示例)
  8. swift压缩图片的方法
  9. 20155313 杨瀚 《网络对抗技术》实验三 免杀原理与实践
  10. 泛函分析在计算机科学中的应用,泛函分析在小波理论中的应用.doc
  11. 电视台‘自制好剧’,大量剧本从何来?
  12. 神经网络各种评判指标
  13. Python视频字幕识别——pytesseract
  14. C++搭建集群聊天室(十四):群聊功能
  15. 计算机图像处理技术的应用分析,计算机图像处理技术特点及应用研究
  16. 只需98RMB Win7升级为专业版Win8
  17. 办公技巧:常用的100个Word快捷键
  18. 2022年莆田市高新技术企业申报奖励补贴,高企认定条件以及申报材料汇总
  19. 金蝶软件怎么过账_金蝶专业版怎么反过账
  20. 【python】plt.cm.Spectral,颜色分配

热门文章

  1. java-背包的实现
  2. “音”你而来,“视”而可见 腾讯云+社区音视频技术开发实战沙龙圆满结束...
  3. Nginx SSL 性能调优
  4. chrome浏览器安装网页测试插件postman的图文步骤记录
  5. 理解CSRF(跨站请求伪造)
  6. javascript arguments对象研究--针对jquery源码研究再研究
  7. Windows Server 8 Tips (二) Hyper-V 3:用PowerShell导出和导入虚拟机
  8. android异步任务更新进度条,Android的AsyncTask异步任务浅析
  9. 最大最小标准化 数值_分享丨实验数据标准化处理方法
  10. 编程计算机教小明加法,Python校本课程第四课——教案