11.34 基于近似动态规划的优化控制研究及 在电力系统中的应用

上世纪 50 年代以来,在空间技术发展和数字计算机实用化的推动下,动态系统的优化理论得到了迅速的发展,形成了一个重要的学科分支——最优控制[1-2] 。它在空间技术、系统工程、多级工艺设备的优化等领域都有越来越广泛的应用。因而更深入研究最优控制问题,无论在理论上,还是在实践上都具有重大的意义。最优控制理论的三大基石是经典变分理论、极小值原理及动态规划。经典变分理论只能解决控制无约束问题,即容许控制属于开集的一类最优控制问题,而工程实践中所遇到的多是容许控制为闭集的一类最优控制问题。对于这一类问题 , 经典变分理论变得无能为力。因而为了适应工程实践的需要,20 世纪 50 年代中期出现了现代变分理论,一种是苏联学者庞特里亚金的“极小值原理” [3] ;另一种是美国学者贝尔曼的“动态规划 (DynamicProgramming,DP)” [4] 。极小值原理不仅适用于处理带开集性约束条件的最优控制问题,而且也适用于处理带有闭集约束条件的最优控制问题。但是对于非线性系统,极小值原理需要求解非线性两点边值问题。这一点在工程实际中很难做到的,一般无法求得最优控制的解析解。

动态规划不仅能处理带有开集性约束条件的最优控制问题, 而且也能处理带有闭集约束条件的最优控制问题,而更为重要的是其给出最优控制的充分条件。但是,动态规划的明显弱点是,计算量和存储量会随着状态和控制向量的维数增加而急剧增加。对于状态向量为 n 维、控制向量为 m 维、时间离散段为 N 的离散系统,在状态向量的每个元取 p个值,控制向量的每个元取 q 个值的情况下,计算性能指标的求值次数为 Np n q m 次 , 需要存储容量为2p n 个字。假定取 N=10、p=q=20、n=6、m=2, 则需要存储量为 1.28 亿字 , 计算次数为 2 560 亿次。很显然,这种巨大的计算量形成了所谓的“维数灾”问题[4] ,极大限制了动态规划的直接应用。

为了解决动态规划的“维数灾”问题,Werbos于 1977 年 提 出 了 近 似 动 态 规 划 (Approximatedynamic programming, ADP) 的基本理论思想[5] ,随后许多学者也开始探讨这方面的问题 , 使得 ADP 理论得到了极大的发展[6-13] 。在 ADP 发展过程中出现了一系列的同义词,如自适应评价设计[6-8] 、自适应动态规划[9] 、增强学习 [10] 、神经动态规划 [11]和启发式动态规划[12]等。2006 年美国科学基金会组织的“2006 NSF Workshop and Outreach Tutorials onApproximate Dynamic Programming”研讨会上 , 建议将该方法统称为“Adaptive/Approximate dynamicprogramming”。 这次专题讨论会奠定了 ADP 在相关研究领域中的重要地位。

近似动态规划是通过利用函数近似结构来近似动态规划中的性能指标函数以及控制函数,利用强化学习机制而来获得最优性能指标函数和最优控制以满足动态规划的最优性原理。近似动态规划的基本思想可用图 1 来说明。近似动态规划的整体结构主要由动态系统 (Dynamic system)、执行 / 控制 (Action/Control) 和评价 / 性能指标函数 (Critic/Performance index function) 三部分组成。每个部分均可由神经网络代替,称为模型网络、评价网络和执行网络。评价网络和执行网络二者的结合相当于一个智能体 (Agent),控制 (Action) 作用于动态系统( 或者被控对象 ) 后,通过被控对象 ( 或者环境 ) 在不同阶段产生的奖励 / 惩罚 (Reward/Penalty) 来影响性能指标函数[7] 。智能体的任务就是学习一个控制策略,使得这些回报(或者惩罚)的总和达到最优。正是由于近似动态规划利用函数近似结构 ( 比如神经络[5] ) 来逼近动态规划方程中的代价函数和控制策略,以满足最优性原理,从而获得最优代价函数和最优控制策略,因而克服了 DP 方法局限性。

《中国人工智能学会通讯》——11.34 基于近似动态规划的优化控制研究及 在电力系统中的应用...相关推荐

  1. 《中国人工智能学会通讯》——12.58 大数据不确定性学习的研究

    12.58 大数据不确定性学习的研究 一个建立在常规数据集上的学习模型和算法一般是不能拓展到大数据的,原因有多个.基于不确定性的学习模型自然也是如此.不确定性的处理对大数据学习更为重要,有些与不确定性 ...

  2. 中国人工智能学会通讯——基于视频的行为识别技术 1.7 视频的深度分段网络...

    1.7 视频的深度分段网络 下面介绍另外一个工作,是我们和 CUHK.ETH 联合开展的,这个工作考 虑视频的分段特性,我们知道视频可以分 成很多段,每一段有不同的内容.我们 开发了一个深度模型,对不 ...

  3. 中国人工智能学会通讯——智能系统测评:挑战和机遇

    上面的四个报告从四个维度讨论了智能系统测评的不同方面--产业.基础.基础和伦理.我受中国人工智能学会的委托,组织这次分论坛,为此对这个领域做了一些调研和思考,从现状和挑战这两个方面做了一些初步总结. ...

  4. 中国人工智能学会通讯——无智能,不驾驶——面向未来的智能驾驶时代 ( 下 )...

    到目前为止似乎比较完美,而实际还 存在着一些问题.我们现在看到很多道 路上面,交通标志牌它的分布非常稀疏, 可能每过一两公里才能够检测出来一个 交通标志牌,因为毕竟这个深度学习算 法是目前最完美的,它 ...

  5. 中国人工智能学会通讯——深蓝、沃森与AlphaGo

    在 2016 年 3 月 份,正当李 世石与AlphaGo 进行人机大战的时候,我曾经写过 一 篇< 人 工 智 能 的 里 程 碑: 从 深 蓝 到AlphaGo>,自从 1997 年深 ...

  6. 《中国人工智能学会通讯》——11.70 基于黎曼流形稀疏表示的视觉目 标跟踪方法...

    11.70 基于黎曼流形稀疏表示的视觉目 标跟踪方法 如引言所述,视觉目标跟踪中表观建模主要分为目标表示和统计建模两部分.上两节主要关注的是在跟踪中如何设计一种有效的统计模型.本节主要关注的是表观建模 ...

  7. 《中国人工智能学会通讯》——11.52 基于直推式学习的异质人脸图像 合成

    11.52 基于直推式学习的异质人脸图像 合成 前面介绍的方法都是基于归纳式学习(InductiveLearning) 的,这些方法取得了不错的效果,但是它们也使得测试样本风险误差增加,进而可能影响合 ...

  8. 《中国人工智能学会通讯》——11.51 基于幻象技术的异质人脸图像合成

    11.51 基于幻象技术的异质人脸图像合成 基于稀疏特征选择的方法,以及现有的大部分算法在合成人脸图像时,多是采用线性组合的方式.线性组合,即线性加权平均,可以看作一低通滤波器,会过滤掉一些高频细节信 ...

  9. 《中国人工智能学会通讯》——11.64 基于成对约束的属性特征选择

    11.64 基于成对约束的属性特征选择 属性学习常面临低层特征维度特别高的问题.例如,在 Animals With Attributes 数据集中,每张图片对应 6 种类型的特征,即 2 688 维的 ...

最新文章

  1. 解决该死的双硬盘蓝屏(错误代码:0x00000007b)!
  2. linux shell中小数的运算
  3. ZendStudio快捷键
  4. Linux 内核开发 - Eclipse内核开发环境搭建
  5. python 如何重定向输出
  6. shell脚本中的条件测试if中的-z到-d的意思
  7. 双向口 与 准双向口 区别
  8. Spring 简化配置(了解/不推荐)
  9. jdk1.5、1.6、1.7新特性详细介绍(整理)
  10. 钣金cad插件_ug,CAD,SolidWorks,钣金??????非标等设计
  11. Visual Studio Code 取色器插件 取色选取 插件安装和使用
  12. 【历史上的今天】8 月 14 日:新浪微博开始内测;阿塔纳索夫完成论文;登上太空的计算机病毒
  13. JAVA---数组从小到大排序方法
  14. 中小型企业网络IP地址规划案例
  15. 浮动时间怎么计算_自由浮动时间 VS 总浮动时间
  16. 百度搜索框代码,实现回车点击,跳转到新页面,简单
  17. 如何解决移动端300ms延迟
  18. 趋势顶底指标公式 通达信趋势顶底主图选股指标 清晰的趋势顶底详解
  19. 2023青海大学计算机考研信息汇总
  20. 一文读懂法拉第未来赴美上市:合并PSAC,能否“卷土重来”?

热门文章

  1. 蓝桥杯 ALGO-141 算法训练 P1102
  2. 2019武汉大学计算机学院拟录取,武汉大学2019年招收攻读硕士研究生复试成绩拟录取名单...
  3. python程序封装成exe_如何将python脚本封装成exe程序?
  4. ORACLE中Like与Instr模糊查询性能大比拼
  5. 忆芯科技发布新一代国产主控芯片STAR1000P!4月完成量产版本
  6. “聆听”升级,阿里云智能喜迎首席聆听官
  7. 让孩子亲近自然,提高家长对户外亲子研学的人生和了解。
  8. 5G汽车联盟与欧洲汽车电信联盟签署合作谅解备忘录
  9. 《基于ArcGIS的Python编程秘笈(第2版)》——第1章 面向ArcGIS的Python语言基础
  10. rocketmq稳定可靠性测试