最长公共子序列和最长公共子串区别

       最长公共子串(Longest Common Substring)最长公共子序列(Longest Common Subsequence)的区别: 子串要求在原字符串中是连续的,而子序列则只需保持相对顺序一致,并不要求连续。例如X = {a, Q, 1, 1}; Y = {a, 1, 1, d, f}那么,{a, 1, 1}是X和Y的最长公共子序列,但不是它们的最长公共字串。

一、最长公共子序列

具体的算法思想参考以下文章:

http://blog.csdn.net/lisonglisonglisong/article/details/41548557

http://blog.csdn.net/zhongkeli/article/details/8847694

只求最长子序列长度

如果仅仅需要知道最长子序列的长度值,代码如下:

[cpp] view plain copy

  1. #include <vector>
  2. #include <string>
  3. #include <iostream>
  4. #include <string.h>
  5. #include <sstream>
  6. using namespace std;
  7. //最长公共子串(LCS)
  8. //二维数组veca记录的是两个字符串Xi和Yj的LCS长度
  9. int LCS_length(const string &str1, const string &str2, vector<vector<int> > &veca) {
  10. int i, j;
  11. int biggest = 0;
  12. if (str1 == "" || str2 == "")
  13. return 0;
  14. for (i = 0; i <= str1.length(); i++) {    //初始化veca[][]
  15. veca[i][0] = 0;
  16. }
  17. for (j = 0; j <= str2.length(); j++) {  ////初始化veca[][]
  18. veca[0][j] = 0;
  19. }
  20. for (i = 1; i <= str1.length(); i++) {
  21. for (j = 1; j <= str2.length(); j++) {
  22. if (str1[i - 1] == str2[j - 1]) {
  23. veca[i][j] = veca[i - 1][j - 1] + 1;
  24. }
  25. else {
  26. if (veca[i - 1][j] >= veca[i][j - 1])
  27. veca[i][j] = veca[i - 1][j];
  28. else
  29. veca[i][j] = veca[i][j-1];
  30. }
  31. }
  32. }
  33. return veca[str1.length()][str2.length()];
  34. }
  35. int main() {
  36. string input;
  37. getline(cin, input);
  38. stringstream ss(input);
  39. string str1, str2;
  40. ss >> str1;
  41. ss >> str2;
  42. //将veca初始化为一个二维数组,其行列值分别为str1和str2的长度加1
  43. //二维数组veca记录的是两个字符串Xi和Yj的LCS长度
  44. vector<vector<int> > veca(str1.length() + 1, vector<int>(str2.length() + 1));
  45. cout << LCS_length(str1, str2, veca) << endl;
  46. return 0;
  47. }

结果:

动态规划解决LCS问题的时间复杂度为 O(mn),这比简单的递归实现要快多了。空间复杂度是O(mn),因为使用了一个动态规划表。

要输出一个LCS的内容

和上面的程序比,只需要多一个二维数组记录在遍历中所选择的子问题的最优解即可。如下程序:

[cpp] view plain copy

  1. //输出最长公共子串(LCS)
  2. //二维数组veca记录的是两个字符串Xi和Yj的LCS长度
  3. int LCS_length(const string &str1, const string &str2,
  4. vector<vector<int> > &veca, vector<vector<int> > &vecb) {
  5. int i, j;
  6. int biggest = 0;
  7. if (str1 == "" || str2 == "")
  8. return 0;
  9. for (i = 0; i <= str1.length(); i++) {
  10. veca[i][0] = 0;
  11. }
  12. for (j = 0; j <= str2.length(); j++) {
  13. veca[0][j] = 0;
  14. }
  15. for (i = 1; i <= str1.length(); i++) {
  16. for (j = 1; j <= str2.length(); j++) {
  17. //如果Xi-1 == Yj-1,那么最长子序列为veca[i - 1][j - 1] + 1
  18. //此时将vecb[i][j] = 1表明str1[i-1]是子问题LCS的一个元素
  19. if (str1[i - 1] == str2[j - 1]) {
  20. veca[i][j] = veca[i - 1][j - 1] + 1;
  21. vecb[i][j] = 1;
  22. }
  23. else {
  24. if (veca[i - 1][j] >= veca[i][j - 1]) {
  25. veca[i][j] = veca[i - 1][j];
  26. vecb[i][j] = 2;
  27. }
  28. else {
  29. veca[i][j] = veca[i][j-1];
  30. vecb[i][j] = 3;
  31. }
  32. }
  33. }
  34. }
  35. return veca[str1.length()][str2.length()];
  36. }
  37. //该函数用于输出一个LCS的序列
  38. //这里输出的顺序是先向上寻找,再向左寻找
  39. void PrintOneLCS(vector<vector<int> > &vecb, string &str1, int i, int j) {
  40. if (i == 0 || j == 0)
  41. return;
  42. if (vecb[i][j] == 1) {
  43. PrintOneLCS(vecb, str1, i - 1, j - 1);
  44. cout << str1[i - 1] << " ";
  45. }
  46. else if (vecb[i][j] == 2)
  47. PrintOneLCS(vecb, str1, i -1, j);
  48. else
  49. PrintOneLCS(vecb, str1, i, j - 1);
  50. }
  51. int main() {
  52. string input;
  53. getline(cin, input);
  54. stringstream ss(input);
  55. string str1, str2;
  56. ss >> str1;
  57. ss >> str2;
  58. //将veca初始化为一个二维数组,其行列值分别为str1和str2的长度加1
  59. //二维数组veca记录的是两个字符串Xi和Yj的LCS长度
  60. //二维数组vecb[i][j]记录veca[i][j]时所选择的子问题的最优解
  61. vector<vector<int> > veca(str1.length() + 1, vector<int>(str2.length() + 1));
  62. vector<vector<int> > vecb(str1.length() + 1, vector<int>(str2.length() + 1));
  63. cout << LCS_length(str1, str2, veca, vecb) << endl;
  64. PrintOneLCS(vecb, str1, str1.length(), str2.length());
  65. return 0;
  66. }

求一个LCS内容也可以不借助辅助二维数组vecb而是用下面小节的方法,

[cpp] view plain copy

  1. //该函数用于输出一个LCS的序列,使用下一小节的方法
  2. //这里输出的顺序是先向左寻找,再向上寻找
  3. void PrintOneLCS(string &str1, string &str2, int i, int j,
  4. vector<vector<int> > &veca) {
  5. string lcs_str;
  6. while (i > 0 && j > 0) {
  7. if (str1[i - 1] == str2[j - 1]) {
  8. lcs_str = str1[i - 1] + lcs_str;
  9. --i;
  10. --j;
  11. }
  12. else {
  13. //如果左边存在LCS就从左边找否则再从右边找
  14. if (veca[i - 1][j] >= veca[i][j - 1])
  15. --i;
  16. else
  17. --j;
  18. }
  19. }
  20. cout << lcs_str << endl;
  21. }

如下代码:

要输出所有LCS的内容

两个字符串对应的最长公共子序列不一定唯一,这个程序输出所有的LCS内容。

基本思想是:

具体参考文章:http://blog.csdn.net/lisonglisonglisong/article/details/41596309

代码:

[cpp] view plain copy

  1. #include <vector>
  2. #include <iomanip>
  3. #include <set>
  4. #include <string>
  5. #include <map>
  6. #include <iostream>
  7. #include <string.h>
  8. #include <sstream>
  9. using namespace std;
  10. set<string> all_lcs; //注意这里要用set去除重复的LCS
  11. //最长公共子串(LCS)
  12. //二维数组veca[i][j]记录的是两个字符串Xi和Yj的LCS长度
  13. int LCS_length(const string &str1, const string &str2, vector<vector<int> > &veca) {
  14. int i, j;
  15. int biggest = 0;
  16. if (str1 == "" || str2 == "")
  17. return 0;
  18. for (i = 0; i <= str1.length(); i++) {
  19. veca[i][0] = 0;
  20. }
  21. for (j = 0; j <= str2.length(); j++) {
  22. veca[0][j] = 0;
  23. }
  24. for (i = 1; i <= str1.length(); i++) {
  25. for (j = 1; j <= str2.length(); j++) {
  26. if (str1[i - 1] == str2[j - 1]) {
  27. veca[i][j] = veca[i - 1][j - 1] + 1;
  28. }
  29. else {
  30. if (veca[i - 1][j] >= veca[i][j - 1])
  31. veca[i][j] = veca[i - 1][j];
  32. else
  33. veca[i][j] = veca[i][j-1];
  34. }
  35. }
  36. }
  37. return veca[str1.length()][str2.length()];
  38. }
  39. //该函数找出所有的LCS的序列,并将其存在vector中
  40. void PrintAllLCS(string &str1, string &str2, int i, int j,
  41. vector<vector<int> > &veca, string lcs_str) {
  42. //注意这里形参lcs_str不可以为引用,这里需要每次调用lcs_str都重新生成一个对象
  43. while (i > 0 && j > 0) {
  44. if (str1[i - 1] == str2[j - 1]) {
  45. lcs_str = str1[i - 1] + lcs_str; //逆向存放
  46. --i;
  47. --j;
  48. }
  49. else {
  50. if (veca[i - 1][j] > veca[i][j - 1]) //向左走
  51. --i;
  52. else if (veca[i - 1][j] < veca[i][j - 1]) //向上走
  53. --j;
  54. else { //此时向上向右均为LCS的元素
  55. PrintAllLCS(str1, str2, i - 1, j, veca, lcs_str);
  56. PrintAllLCS(str1, str2, i, j - 1, veca, lcs_str);
  57. return;
  58. }
  59. }
  60. }
  61. cout << "   " << lcs_str << endl;
  62. all_lcs.insert(lcs_str);
  63. }
  64. int main() {
  65. string input;
  66. getline(cin, input);
  67. stringstream ss(input);
  68. string str1, str2;
  69. ss >> str1;
  70. ss >> str2;
  71. //将veca初始化为一个二维数组,其行列值分别为str1和str2的长度加1
  72. //二维数组veca记录的是两个字符串Xi和Yj的LCS长度
  73. vector<vector<int> > veca(str1.length() + 1, vector<int>(str2.length() + 1));
  74. cout << LCS_length(str1, str2, veca) << endl;
  75. string lcs_str;
  76. PrintAllLCS(str1, str2, str1.length(), str2.length(), veca, lcs_str);
  77. set<string>::iterator iter = all_lcs.begin();
  78. while (iter != all_lcs.end()) {
  79. cout << *iter++ << endl;
  80. }
  81. return 0;
  82. }

如图所示的两个字符串共有三个LCS。

二、最长公共子串

描述:

计算两个字符串的最大公共子串(Longest Common Substring)的长度,字符不区分大小写。

输入:

输入两个字符串

输出:

输出一个整数

样例输入:

asdfas werasdfaswer

样例输出:

6

这里的最大公共字串要求的字串是连续的。

求字串的方法和求子序列方法类似:

当str1[i] == str2[j]时,子序列长度veca[i][j] = veca[i - 1][j - 1] + 1;只是当str1[i] != str2[j]时,veca[i][j]长度要为0,而不是max{veca[i - 1][j], veca[i][j - 1]}。

[cpp] view plain copy

  1. #include <vector>
  2. #include <string>
  3. #include <iostream>
  4. #include <string.h>
  5. #include <sstream>
  6. using namespace std;
  7. int LCS_length(const string &str1, const string &str2, vector<vector<int> > &veca) {
  8. int i, j;
  9. int biggest = 0;
  10. if (str1 == "" || str2 == "")
  11. return 0;
  12. for (i = 0; i <= str1.length(); i++) {
  13. veca[i].resize(str2.length() + 1, 0);
  14. }
  15. for (j = 0; j <= str2.length(); j++) {
  16. veca[0][j] = 0;
  17. }
  18. for (i = 1; i <= str1.length(); i++) {
  19. for (j = 1; j <= str2.length(); j++) {
  20. if (str1[i - 1] == str2[j - 1]) {
  21. veca[i][j] = veca[i - 1][j - 1] + 1;
  22. if (veca[i][j] > biggest)
  23. biggest = veca[i][j];
  24. }
  25. else
  26. //可以看出,求最长子串和求最长子序列差别仅仅在这里
  27. veca[i][j] = 0;
  28. }
  29. }
  30. return biggest;
  31. }
  32. int main() {
  33. string input;
  34. getline(cin, input);
  35. stringstream ss(input);
  36. string str1;
  37. ss >> str1;
  38. string str2;
  39. ss >> str2;
  40. vector<vector<int> > veca(str1.length() + 1);
  41. cout << LCS_length(str1, str2, veca) << endl;
  42. return 0;
  43. }

同样适用求最长子序列的测试数据,得到它们的公共最长子串长度为2,而它们的公共最长子序列长度为4.

三、动态规划的其它题目

1、硬币面值组合问题

http://www.cnblogs.com/python27/archive/2013/09/05/3303721.html

2、最长递增子序列

除了动态规划,该题还有其他解法。

3、数组最大子数组和的最大值

http://www.ahathinking.com/archives/120.html

3、动态规划之钢条分割

4、计算两个字符串的相似度(编程之美)

该文章原理说得比较清楚:点击打开链接

这里是代码:点击打开链接

5、求每一对顶点之间的最短路径:Floyd-Warshall算法

转自:https://blog.csdn.net/u013074465/article/details/45392687

动态规划算法---求最长公共子序列相关推荐

  1. 用动态规划算法实现最长公共子序列问题的算法(java实现)

    用动态规划算法实现最长公共子序列问题的算法 public class longestCommonSubsequence {//构造追踪数组rec,记录子问题来源private static Strin ...

  2. 动态规划算法解最长公共子序列LCS问题

    动态规划算法解LCS问题 作者 July 二零一零年十二月三十一日 本文参考:微软面试100题系列V0.1版第19.56题.算法导论.维基百科. 第一部分.什么是动态规划算法 ok,咱们先来了解下什么 ...

  3. 动态规划_求最长公共子序列LCS

    学习动态规划有段时间了,我自己的感觉是看到题解很明白,但是拿到新题就后脑冒汗了,费解!我知道这其实是理解不深的缘故,动态规划是解决一类问题的方法,而不是解决某个问题的解法.今天我试着去感觉一下怎么去思 ...

  4. 动态规划:求最长公共子序列和最长公共子串

    最长公共子序列(LCS): 这同样是一道经典题目,定义就不说了. 为了方便说明,我们用Xi代表{x1,x2,‥xi},用Yj代表{y1,y2,‥yj}.那么,求长度分别为m,n的两个序列X,Y的LCS ...

  5. 算法复习——动态规划篇之最长公共子序列问题

    算法复习--动态规划篇之最长公共子序列问题 以下内容主要参考中国大学MOOC<算法设计与分析>,墙裂推荐希望入门算法的童鞋学习! 1. 问题背景 子序列:将给定序列中零个或多个元素(如字符 ...

  6. 蓝桥杯 ADV-202算法提高 最长公共子序列(动态规划)

    问题描述 给定两个字符串,寻找这两个字串之间的最长公共子序列. 输入格式 输入两行,分别包含一个字符串,仅含有小写字母. 输出格式 最长公共子序列的长度. 样例输入 abcdgh aedfhb 样例输 ...

  7. 【To Understand】动态规划:求最长公共子串/最长公共子序列

    动态规划:求最长公共子串/最长公共子序列 本博客转载自:https://blog.csdn.net/u013074465/article/details/45392687 该博客中详细讲解了求最长公共 ...

  8. Algorithm:C++/python语言实现之求旋转数组最小值、求零子数组、求最长公共子序列和最长公共子串、求LCS与字符串编辑距离

    Algorithm:C++/python语言实现之求旋转数组最小值.求零子数组.求最长公共子序列和最长公共子串.求LCS与字符串编辑距离 目录 一.求旋转数组最小值 1.分析问题 2.解决思路 二.求 ...

  9. LCS算法:最长公共子序列

    LCS算法:最长公共子序列定义: 一个序列A任意删除若干个字符得到新序列B,则A叫做B的子序列 两个序列X和Y的公共子序列中,长度最长的那个,定义为X和Y的最长公共子序列 例如: X={A,B,C,B ...

最新文章

  1. UVa1112 - Mice and Maze(Dijkstra和Floyd_warshall)
  2. 工业领域产品经理的尴尬处境
  3. 【Cef编译】 CefSharp编译失败,检测到“RuntimeLibrary”的不匹配项: 值“MT_StaticRelease”不匹配值“MD_DynamicRelease”...
  4. stm32usb做虚拟串口和键盘_关于stm32f103的USB虚拟串口程序移植
  5. Jquery Mobile dialog的生命周期
  6. 2019年网络安全状况_知道吗,如何加强个人的网络安全状况?
  7. 关于服务网关的几个问题
  8. 云存储是否能拯救数据泛滥
  9. nyoj1140鸡蛋栈(怒切一水)
  10. 矩阵直接分解法matlab,矩阵直接三角分解法
  11. 网站打开慢解决办法——在Google Chrome浏览器中安装ReplaceGoogleCDN插件
  12. .net mysql参数化查询_MySQL参数化查询的IN 和 LIKE
  13. java判断颜色合法_判断颜色是否合法的正则表达式(详解)
  14. 基于java的简单英雄联盟胜率计算
  15. 哈工大计算机系统Lab4.Tiny Shell
  16. Python面向对象基础练习——设计一个名为 MyRectangle 的矩形类来表示矩形
  17. 移动通信发展历程见解(从1G到5G发展历程)
  18. Hdu5128 - The E-pang Palac
  19. C语言 - 指针 1.2:指针和数组
  20. 自然语言处理NLP——GSDMM用于短文本聚类

热门文章

  1. 网络重置导致无法联网
  2. 打包aab,从AAB文件生成Apk文件(Android应用程序捆绑包)
  3. 【Photoshop】把同一场景中但焦点不一样的多张照片合成一张焦点清晰的图片
  4. 计算机打印预览在哪,excel打印在哪里,EXCEL怎么退出成打印预览的画面
  5. 3.18 使用橡皮擦工具制作图像合成效果 [原创Ps教程]
  6. 非常全面的支付宝钱包系统架构图解
  7. 如何让百度、Google、Yahoo等搜索引擎巨头收录你的网站
  8. win10控制面板快捷键_在win10打开注册表编辑器的七种方法,你知道几种
  9. 动作游戏的战斗系统设计
  10. 我的Android进阶之旅------/storage/sdcard0, /sdcard, /mnt/sdcard ,/storage/emulated/legacy 的区别