这篇我们看看 最长公共子序列 的另一个版本,求字符串相似度(编辑距离),我也说过了,这是一个非常实用的算法,在DNA对比,网页聚类等方面都有用武之地。

一:概念

对于两个字符串 A 和 B,通过基本的增删改将字符串 A 改成 B,或者将 B 改成 A,在改变的过程中使用的最少步骤称之为: 编辑距离。比如如下的字符串:我们通过种种操作,痉挛之后编辑距离为3,不知道你看出来了没有?

二:解析

可能大家觉得有点复杂,不好理解,我试着把这个大问题拆分掉,将 字符串 vs 字符串,分解成 字符 vs 字符串,再分解成字符 vs 字符。

1. 字符 vs 字符

这种情况是最简单的了,比如 A 与 B 的编辑距离很显然是1。

2. 字符 vs 字符串

A 改成 AB 的编辑距离为1,A 与 ABA 的编辑距离为2。

3. 字符串 vs 字符串

ABA 和 BBA 的编辑距离为1,仔细发现可以得出如下结论,ABA 是由2^3个子序列与 BBA 字符串求的的编辑距离集合中取出的最小编辑距离,也就是说在这种情况下我们出现了重复计算的情况,我在求子序列 AB 和 BBA 的编辑距离时,我是由子序列 A 和 BBA 与 B 和 BBA 之间的编辑距离中选出一个最小值,然而序列A和序列B早之前我已经计算过了,这种重复计算的问题有点像 斐波那契,正好满足动态规划中的最优子结构和重叠子问题,所以我决定采用动态规划来解决。

三:公式

跟最长公共子序列一样,可以采用一个二维数组来保存字符串 X 和 Y 当前的位置的最小编辑距离。现有两个序列X={x1,x2,x3,...xi},Y={y1,y2,y3,....,yi}。

设一个C[i,j]: 保存Xi与Yj的当前最小的LD。

当 Xi = Yi 时,则C[i,j]=C[i-1,j-1];

当 Xi != Yi 时, 则C[i,j]=Min{C[i-1,j-1],C[i-1,j],C[i,j-1]};

最终我们的C[i,j]一直保存着最小的LD。

四:代码

using System;

namespace ConsoleApplication2

{

public class Program

{

static int[,] martix;

static string str1 = string.Empty;

static string str2 = string.Empty;

static void Main(string[] args)

{

while (true)

{

str1 = Console.ReadLine();

str2 = Console.ReadLine();

martix = new int[str1.Length + 1, str2.Length + 1];

Console.WriteLine("字符串 {0} 和 {1} 的编辑距离为:{2}\n", str1, str2, LD());

}

}

///

/// 计算字符串的编辑距离

///

///

public static int LD()

{

//初始化边界值(忽略计算时的边界情况)

for (int i = 0; i <= str1.Length; i++)

{

martix[i, 0] = i;

}

for (int j = 0; j <= str2.Length; j++)

{

martix[0, j] = j;

}

//矩阵的 X 坐标

for (int i = 1; i <= str1.Length; i++)

{

//矩阵的 Y 坐标

for (int j = 1; j <= str2.Length; j++)

{

//相等情况

if (str1[i - 1] == str2[j - 1])

{

martix[i, j] = martix[i - 1, j - 1];

}

else

{

//取“左前方”,“上方”,“左方“的最小值

var temp1 = Math.Min(martix[i - 1, j], martix[i, j - 1]);

//获取最小值

var min = Math.Min(temp1, martix[i - 1, j - 1]);

martix[i, j] = min + 1;

}

}

}

//返回字符串的编辑距离

return martix[str1.Length, str2.Length];

}

}

}

Java获取相同字符串算法题,数据结构与算法专题——第四题 字符串相似度相关推荐

  1. 算法java语言描述_java语言描述数据结构与算法崔笑颜的博客

    java语言描述数据结构与算法崔笑颜的博客 冒泡排序 插入排序 选择排序 希尔排序 快速排序 归并排序 二分查找package com.demo.test; import java.util.Arra ...

  2. java set第n位_数据结构与算法——常用数据结构及其Java实现

    本文采用Java语言来进行描述,帮大家好好梳理一下数据结构与算法,在工作和面试中用的上.亦即总结常见的的数据结构,以及在Java中相应的实现方法,务求理论与实践一步总结到位. 常用数据结构 数组 数组 ...

  3. java树的基本知识_Java数据结构和算法(二)树的基本操作

    Java数据结构和算法(二)树的基本操作 一.树的遍历 二叉树遍历分为:前序遍历.中序遍历.后序遍历.即父结点的访问顺序 1.1 前序遍历 基本思想:先访问根结点,再先序遍历左子树,最后再先序遍历右子 ...

  4. 尚硅谷01 数据结构与算法_数据结构与算法介绍+稀疏数组

    数据结构与算法的关系 几个实际编程中遇到的问题 要想写出优秀的算法,首先应该能读懂别人写好的算法. 将生活中遇到的实际问题,使用程序来解决 线性结构和非线性结构 线性结构和非线性结构的关系: 数据结构 ...

  5. 算法与数据结构(part1)--算法简介及大O表示法

    学习笔记,仅供参考 文章目录 算法与数据结构--基于python 数据结构和算法简介 算法引入 例题A 算法的概念 例题A的优化 算法效率的衡量 时间复杂度与大O记法 例题A的时间复杂度 如何理解大O ...

  6. 循环首次适应算法_数据结构与算法之2——排序问题

    排序真的是数据结构与算法中的重中之重啊,无论是对编程能力的提升,以后工作后的应用,或者是应对面试的时候都是经常需要用到的.基本的几个经典排序一定要做到滚瓜烂熟,能够做到给你一个具体的排序算法题,一定能 ...

  7. 什么是算法?数据结构与算法概念

    算法的概念 算法是计算机处理信息的本质,因为计算机程序本质上是一个算法来告诉计算机确切的步骤来执行一个指定的任务.一般地,当算法在处理信息时,会从输入设备或数据的存储地址读取数据,把结果写入输出设备或 ...

  8. 【图解数据结构与算法】数据结构与算法知识点整理 Data Structures and Algorithms

    程序=数据结构+算法 数据结构是可以存储和组织数据的命名位置. 算法是用于解决特定问题的一组步骤. 数据结构是指:一种数据组织.管理和存储的格式,它可以帮助我们实现对数据高效的访问和修改. 数据结构 ...

  9. python数据结构算法_数据结构与算法(Python)

    数据结构与算法(Python) Why? 我们举一个可能不太恰当的例子: 如果将最终写好运行的程序比作战场,我们码农便是指挥作战的将军,而我们所写的代码便是士兵和武器. 那么数据结构和算法是什么?答曰 ...

  10. prim算法_数据结构与算法

    根据MOOC上课程总结,文章目录为: 一.引论 数据结构的基本概念 数据的逻辑结构和存储结构 算法及其时间复杂度 时间复杂度及应用 二.线性表 线性表的概念及顺序存储 单链表的概念及其基本操作 建立单 ...

最新文章

  1. 蜻蜓大脑算法速度超快,AI科学家:拿来吧你
  2. lua学习笔记之开始
  3. redis源码解读二
  4. C语言中函数如何返回结构体?
  5. python 新建html_Python学习第226课——html中创建按钮
  6. 这道笔试题竟然运行不出错
  7. Riddle(2018 CCPC (秦皇岛站) I 题)
  8. 案例展示自定义C函数的实现过程
  9. 04_过滤器Filter_04_Filter生命周期
  10. 用glew,glfw实现的opengl 学习笔记2画一个四方形
  11. 宏观经济学——GDP
  12. Python(爬虫篇)--- 验证码破解【二】滑块验证码
  13. 【AI简报20211203期】国产GPU全面开花!黑芝麻智能与RT-Thread达成战略合作
  14. docker中的localhost
  15. 【IDEA】IDEA修改项目名称
  16. 为了陪妹子打王者,没有天赋的我写了一个AI机器人替我操作
  17. 直播预告|ICML专场最后一场啦!来蹲守直播间呀
  18. 卡尔卡西25首练习曲简析-音阶与音程训练
  19. 微信小程序开发工具介绍及安装(下)
  20. 中兴c600olt数据配置_中兴OLT开局数据配置、工程规范、版本升级介绍.ppt

热门文章

  1. 训练模型前数据是不是这样处理会更好
  2. jittor和pytorch生成网络对比之dragan
  3. 使用bert或者xlnet做预测类的事情
  4. pytorch 之手写数字生成网络
  5. 条件概率计算代替RNN
  6. 服务监控-URL接口监控
  7. day060 ajax文件上传 json补充
  8. double转换为int以及浮点型相加损失精度问题
  9. Django restframework之Token验证的缺陷及jwt的简单使用
  10. Java中创建对象的几种方式