一、适用范围

每种方法都有自身的局限性,动态规划法也不是万能的。动态规划适合求解多阶段(状态转换)决策问题的最优解,也可用于含有线性或非线性递推关系的最优解问题,但是这些问题都必须满足最优化原理和子问题的“无后向性”。

  • 最优化原理:最优化原理其实就是问题的最优子结构的性质,如果一个问题的最优子结构是不论过去状态和决策如何,对前面的决策所形成的状态而言,其后的决策必须构成最优策略。也就是说,不管之前决策是否是最优决策,都必须保证从现在开始的决策是在之前决策基础上的最优决策,则这样的最优子结构就符合最优化原理。
  • 无后向性(无后效性):所谓“无后向性”,就是当各个阶段的子问题确定以后,对于某个特定阶段的子问题来说,它之前的各个阶段的子问题的决策只影响该阶段的决策,对该阶段之后的决策不产生影响,也就是说,每个阶段的决策仅受之前决策的影响,但是不影响之后各阶段的决策。

二、基本思想

和分治法一样,动态规划解决复杂问题的思路也是对问题进行分解,通过求解小规模的子问题再反推出原问题的结果。但是动态规划分解子问题不是简单地按照“大事化小”的方式进行的,而是沿着决策的阶段划分子问题,决策的阶段可以随时间划分,也可以随着问题的演化状态划分。分治法要求子问题是互相独立的,以便分别求解并最终合并出原始问题的解,但是动态规划法的子问题不是互相独立的,子问题之间通常有包含关系,甚至两个子问题可以包含相同的子子问题。比如,子问题A的解可能由子问题C的解递推得到,同时,子问题B的解也可能由子问题C的解递推得到。对于这种情况,动态规划法对子问题C只求解一次,然后将其结果保存在一张表中(此表也称为备忘录),避免每次遇到这种情况都重复计算子问题C的解。除此之外,动态规划法的子问题还要满足“无后向性”要求。动态规划法不像贪婪法或分治法那样有固定的算法实现模式,作为解决多阶段决策最优化问题的一种思想,它没有具体的实现模式,可以用带备忘录的递归方法实现,也可以根据堆叠子问题之间的递推公式用递推的方法实现。但是从算法设计的角度分析,使用动态规划法一般需要四个步骤,分别是定义最优子问题、定义状态、定义决策和状态转换方程以及确定边界条件,这四个问题解决了,算法也就确定了。接下来就结合几个实例分别介绍这四个步骤,这几个例子分别是《算法导论》一书]中介绍的装配站问题、前文提到的背包问题以及经典的最长公共子序列问题(longest common subsequence)。

三、通用步骤

1.定义最优子问题 
        定义最优子问题,也就是确定问题的优化目标以及如何决策最优解,并对决策过程划分阶段。所谓阶段,可以理解为一个问题从开始到解决需要经过的环节,这些环节前后关联。划分阶段没有固定的方法,根据问题的结构,可以按照时间顺序划分阶段,也可以按照问题的演化状态划分阶段。阶段划分以后,对问题的求解就变成对各个阶段分别进行最优化决策,问题的解就变成按照阶段顺序依次选择的一个决策序列。
       装配站问题的阶段划分比较清晰,把工件从一个装配站移到下一个装配站就可以看作是一个阶段,其子问题就可以定义为从一个装配站转移到下一个装配站,直到最后一个装配站完成工件组装。对于背包问题,每选择装一个物品就可以看作一个阶段,其子问题就可以定义为每次向包中装一个物品,直到超过背包的最大容量为止。最长公共子序列问题可以按照问题的演化状态划分阶段,这需要首先定义状态,有了状态的定义,只要状态发生了变化,就可以认为是一个阶段。

2.定义状态
       状态既是决策的对象,也是决策的结果,对于每个阶段来说,对起始状态施加决策,使得状态发生改变,得到决策的结果状态。初始状态经过每一个阶段的决策(状态改变)之后,最终得到的状态就是问题的解。当然,不是所有的决策序列施加于初始状态后都可以得到最优解,只有一个决策序列能得到最优解。状态的定义是建立在子问题定义的基础上的,因此状态必须满足“无后向性”要求。必要时,可以增加状态的维度,引入更多的约束条件,使得状态定义满足“无后向性”要求。
        装配站问题的实质就是在不同的装配线之间选择装配站,使得工件装配完成的时间最短,其状态s[i]就可以定义为通过第i条装配线的第;个装配站所需要的最短时间。背包问题本身是个线性过程,但是如果简单将状态定义为装入的物品编号,也就是定义s[il为装入第i件物品后获得的最大价值,则子问题无法满足“无后向性”要求,原因是之前的任何一个决策都会影响到所有的后序决策(因为装入物品后背包容量发生了变化),因此需要增加一个维度的约束。考虑到每装入一个物品,背包的剩余容量就会减少,故而选择将背包容量也包含的状态定义中。最终背包问题的状态s[i,j]定义为将第i件物品装入容量为i的背包中所能获得的最大价值。对于最长公共子序列问题,如果定义strl[1...i]为第一个字符串前i个字符组成的子串,定义str2[1...j为第二个字符串的前i个字符组成的子串,则最长公共子序列问题的状态s[i,j]定义为strl[1...i]与str2[1...j]的最长公共子序列长度。

3.定义决策和状态转换方程
        定义决策和状态转换方程。决策就是能使状态发生转变的选择动作,如果选择动作有多个,则决策就是取其中能使得阶段结果最优的那一个。状态转换方程是描述状态转换关系的一系列等式,也就是从n-1阶段到n阶段演化的规律。状态转换取决于子问题的堆叠方式,如果状态定义得不合适,就会导致子问题之间没有重叠,也就不存在状态转换关系了。没有状态转换关系,动态规划也就没有意义了,实际算法就退化为像分治法那样的朴素递归搜索算法。
        对于装配站问题,其决策就是选择在当前工作线上的下一个工作站继续装配,或者花费一定的开销将其转移到另一条工作线上的下一个工作站继续装配。如果定义a[i,j]为第i条工作线的第;个装配站需要的装配时间,k[i,j]为从另一条工作线转移到第i条装配线的第/个装配站需要的转移开销,则装配站问题的状态转换方程可以描述为:

背包问题的决策很简单,就是判断装入第i件物品获得的收益最大还是不装入第i件物品获得的收益最大。如果不装入第i件物品,则背包内物品的价值仍然是s[i-1,j]状态,如果装入第i件物品,则背包内物品的价值就变成 状态,其中 和   分别是第i件物品的容积和价值,决策的状态转换方程就是:

最长公共子序列问题的决策方式就是判断strl[i]和str2[i]的关系,如果strl[i]与str2[i]相同,则公共子序列的长度应该是s[i-1,j-1]+1,否则就分别尝试匹配strl[1....i+1]与str2[1...j]的最长公共子串,以及strl[1...i]与str2[1...j+1]的最长公共子串,然后取二者中较大的那个值作为s[i,j]的值。最长公共子序列问题的状态转换方程就是:

4.确定边界条件
       对于递归加备忘录方式(记忆搜索)实现的动态规划方法,边界条件实际上就是递归终结条件,无需额外的计算。对于使用递推关系直接实现的动态规划方法,需要确定状态转换方程的递推式的初始条件或边界条件,否则无法开始递推计算。
        对于装配站问题,初始条件就是工件通过第一个装配站的时间,对于两条装配线来说,工件通过第一个装配站的时间虽然不相 同,但是都是确定的值,就是移入装配线的开销加上第一个装配站的装配时间。因此装配站问题的边界条件就是:
                                             s[1,1]=k[1,1]+a[1,1]
                                             s[2,1]=k[2,2]+a[2,2]
         背包问题的边界条件很简单,就是没有装入任何物品的状态:
                                            s[0,Vmax]=0
         确定最长公共子序列问题的边界条件,要从其决策方式入手,当两个字符串中的一个长度为0的时候,其公共子序列长度肯定是0,因此其边界条件就是:
                                            s[i,j]=0; i=0或j=0

动态规划系列——原理与思想相关推荐

  1. 动态规划系列问题—从小白到大佬的入门、进阶之旅!!!

    前言 本篇文章写了将近一万五千字,整理了关于动态规划系列问题的绝大部分分支,包括动态规划的介绍,相关术语等基础内容,也有区间DP,状压DP等进阶知识. 不管你是刚学习该算法的小白,还是对该算法有了一定 ...

  2. 九十四、动态规划系列之路径问题

    @Author:Runsen 在动态规划最短路径经常提及,在上几篇介绍过相关的最短路径的问题,介绍过使用Dijkstra算法去求解,但是Dijkstra算法是基于贪心算法,按路径长度递增的次序一步一步 ...

  3. 第二部分Calendar原理和思想

    第二部分 Calendar的原理和思想 我们使用Calendar,无非是操作Calendar的"年.月.日.星期.时.分.秒"这些字段.下面,我们对这些字段的的来源.定义以及计算方 ...

  4. 最小二乘和极大似然估计的原理,思想?相同点以及异同?

    简述最小二乘和极大似然估计的原理,思想?相同点以及异同? 最小二乘估计和极大似然估计 简述最小二乘和极大似然估计的原理,思想?相同点以及异同? 1.多元线性回归方程的矩阵表示 1.1 最小二乘估计的原 ...

  5. java动态规划鸡蛋问题_动态规划系列/高楼扔鸡蛋问题.md · lipengfei/fucking-algorithm - Gitee.com...

    # 经典动态规划问题:高楼扔鸡蛋 今天要聊一个很经典的算法问题,若干层楼,若干个鸡蛋,让你算出最少的尝试次数,找到鸡蛋恰好摔不碎的那层楼.国内大厂以及谷歌脸书面试都经常考察这道题,只不过他们觉得扔鸡蛋 ...

  6. 动态规划算法原理及案例

    参考链接:https://www.cnblogs.com/huststl/p/8664608.html 动态规划基本概念 定义:动态规划的意义就是通过采用递推(或者分而治之)的策略,通过解决大问题的子 ...

  7. Spring框架系列之AOP思想

    微信公众号:compassblog 欢迎关注.转发,互相学习,共同进步! 有任何问题,请后台留言联系! 1.AOP概述 (1).什么是 AOP AOP 为 Aspect Oriented Progra ...

  8. 漫画:动态规划系列 第一讲

    01 概念讲解 讲解动态规划的资料很多,官方的定义是指把多阶段过程转化为一系列单阶段问题,利用各阶段之间的关系,逐个求解.概念中的各阶段之间的关系,其实指的就是状态转移方程.很多人觉得DP难(下文统称 ...

  9. 九十三、动态规划系列之股票问题(下)

    @Author:Runsen 动态规划必须要面对股票系列,背包系列差不多了,那就上吧. 股票买卖这一类的问题,都是给一个输入数组,里面的每个元素表示的是每天的股价,并且你只能持有一支股票(也就是你必须 ...

最新文章

  1. Java的File类
  2. 微信小程序 canvas 内容(宽高) 兼容不同机型
  3. netcore dapper mysql_.NET Core Dapper操作mysql数据库
  4. pythonlocust使用方法_使用python的locust库进行性能测试
  5. numberformatexception是什么异常_处理Java异常的9个最佳实践
  6. 计算机二级选择题40分,2017年计算机二级选择题及答案
  7. 火狐浏览器手机版_hao123导航app下载-hao123浏览器手机版下载
  8. 使用android日志工具
  9. 虚拟机里ubuntu扩容主分区/dev/sda1
  10. 进阶14 File类、遍历、递归
  11. oracle rac实例停止,oracle rac启停命令使用实例
  12. 设置Emeditor为Python的简易开发工具
  13. LabelImg使用方法
  14. cmd命令行中文显示乱码
  15. 美团BERT的探索和实践
  16. html级联选择器,jquery实现 级联选择器
  17. 解决 “Windows 功能” 没有Hyper-V
  18. 【牛客网华为机试】HJ32 密码截取
  19. 中国超级计算机计算圆周率,圆周率都已算到31.4万亿位,为什么超级计算机还在算圆周率?...
  20. 网校系统需要哪些功能?

热门文章

  1. hexo 本地图片不显示
  2. python爬微博数据合法吗_GitHub - ChaliceRunRunRun/weibo-crawler: 新浪微博爬虫,用python爬取新浪微博数据...
  3. 我的同事妹妹深夜来我家问我MyBatis源码解析,我是这样给她讲的
  4. SpringBoot整合Redis - @Cacheable 和 RedisTemplate
  5. Linux查看本机局域网IP命令
  6. 有源淹没分析arcgis_洪涝有源淹没算法及淹没结果分析
  7. 【NIO与Netty】Netty 入门
  8. From line 6, column 36 to line 6, column 71: Cannot apply ‘-‘ to arguments of type ‘<VARCHAR(214748
  9. Windows1.0到Windows10三十年进化史,你还记得自己最初使用的系统吗?
  10. 比较知名的外包系统软件开发公司有哪些是哪个