基于强化学习的空调系统运行优化OPTIMIZATIONOF-同济大学

基于强化学习的空调系统运行优化

王尉同 1 潘毅群 1 黄治钟 2

1

(同济大学 机械与能源工程学院,上海 201804

2 同济大学 中德工程学院,上海 201804)

摘要:空调系统运行优化是建筑节能的重要组成部分。本文将强化学习算法应用在空调系

统运行优化中。首先建立空调系统运行优化任务的马尔科夫决策过程模型,接下来确立规

则对探索空间进行进一步缩减,使探索过程尽可能满足系统设备运行和被控区域舒适度的

约束,最后应用 Q-Learning 算法探索学习不断改进控制策略。通过仿真案例对算法进行了

测试。采用动态仿真软件 TRNSYS 和 MATLAB 进行联合仿真,对被控区域送风量进行了

优化,仿真结果显示,与基于固定规则的控制策略和 PID 控制相比,本文提出的基于强化

学习的控制方法可以在小幅提升被控区域舒适度的同时可将运行费用分别降低超过 7%和

4.5% 。

关键词:空调系统;运行优化;强化学习;Q-Learning

OPTIMIZATION OF HVAC SYSTEM

OPERATION BASED ON

REINFORCEMENT LEARNING

Abstract: The operation optimization of HVAC system is an essential part of building energy

conservation. In this work, reinforcement learning technique is applied to optimize HVAC system

operation. Firstly, we formulate the HVAC system operation as a Markov decision process.

Secondly, rules are defined to shrinkage the exploration space in order to avoid violating equipment

operation constraints and conditioned zones comfort constraints during exploration. Finally, Q-

Learning algorithm is deployed to improve the control strategy through interacting with the

environment. This study tests the algorithm by a simulation case. Dynamic simulation program

TRNSYS and MATLAB are utilized to conduct co-simulation. Results show that, compared with

fixed rule-based control strategy and PID controller, reinforcement learning controller can reduce

energy cost by over 7% and 4.5% separately by adjusting supply air flow rate, and at the same time

improve occupants comfort level slightly.

Keywords: HVAC system; operation optimization; reinforcement learning; Q-Learning

0. 引言

空调系统运行优化是建筑节能的重要组成部分。建筑运行优化的基本目标是在满足被

控区域舒适度要求的前提下尽可能的降低能耗或者能耗消费。为了适应室外不断变化的天

气情况和室内负荷变化情况,如何动态调整系统中的设定值或者运行规则从而提高建筑能

效一直是建筑运行优化的研究重点。

经典控制器包括基于规则的控制(如启停控制),PID 控制等由于结构简单,初投资较

低被广泛应用,然而空调系统是典型的高度非线性、不确定性、时变性、耦合性的复杂系

matlab 陈学松,基于强化学习的空调系统运行优化OPTIMIZATIONOF-同济大学.PDF相关推荐

  1. 使用MATLAB/simulink与PreScan联合进行基于强化学习的自动驾驶系统设计与仿真

    使用MATLAB/simulink与PreScan联合进行基于强化学习的自动驾驶系统设计与仿真 总论 环境配置 系统搭建 总论 使用MATLAB中的强化学习工具箱作为核心算法的建立工具,在simuli ...

  2. 《强化学习周刊》第26期:UCL UC Berkeley发表深度强化学习中的泛化研究综述、JHU推出基于强化学习的人工决策模型...

    No.26 智源社区 强化学习组 强 化 学  习 研究 观点 资源 活动 关于周刊 强化学习作为人工智能领域研究热点之一,其研究进展与成果也引发了众多关注.为帮助研究与工程人员了解该领域的相关进展和 ...

  3. dncnn图像去噪_基于强化学习的图像去噪方法与流程

    本发明属于图像处理技术领域,涉及一种基于机器学习技术,采用强化学习去除图像噪声的方法. 背景技术: 随着计算机技术的发展,人们对于图像质量的要求越来越高.但是,由于环境或拍摄设备等因素,能够获得图像通 ...

  4. 【DeepExploit】基于强化学习的自动渗透工具

    文章目录 1. 研究背景 1.1 自动化渗透测试研究背景 1.2 DeepExploit简介 1.3 Metasploit简介 1.3.1 Metasploit渗透步骤--以MS17-010为例 1. ...

  5. 【强化学习与机器人控制论文 2】基于强化学习的五指灵巧手操作

    基于强化学习的五指灵巧手操作 1. 引言 2. 论文解读 2.1 背景 2.2 论文中所用到的强化学习方法 2.3 实验任务和系统 2.4 仿真到实物的迁移 2.5 分布式RL训练--从状态中学到控制 ...

  6. [论文]基于强化学习的无模型水下机器人深度控制

    基于强化学习的无模型水下机器人深度控制 摘要 介绍 问题公式 A.水下机器人的坐标框架 B.深度控制问题 马尔科夫模型 A.马尔科夫决策 B.恒定深度控制MDP C.弯曲深度控制MDP D.海底追踪的 ...

  7. 强化学习3——基于强化学习的四足机器人运动控制

    一.问题描述 传统的机器人行走控制如图1所示. 图1 传统机器人运动控制框图 包括三个环:平衡控制.运动轨迹控制.电机控制.传统的控制需要利用外部的视觉信号以及机器人的传感器获取环境及自身的状态信息, ...

  8. 基于强化学习的多战机同SEAD联合作战空战辅助决策(改进版)

    基于强化学习的多战机同SEAD联合作战空战辅助决策(改进版) 1.基础知识 这部分的基础知识可以参考以前的博文:基于强化学习的多战机同SEAD联合作战空战辅助决策 2.之前的工作 之前运用强化学习的知 ...

  9. 【强化学习与机器人控制论文 3】基于强化学习的五指灵巧手玩转魔方

    这里写目录标题 1. 引言 2. 论文解读 2.1 背景 2.2 硬件平台和仿真平台的搭建 2.3 主要算法框架 2.4 自动域随机化ADR 2.5 实验结果 3. 总结 1. 引言 本文介绍一篇Op ...

  10. 基于强化学习的坦克大战python语言实现

    这个项目是基于一个人工智能算法(基于全连接线性BP网络的增强学习模型)代理玩经典游戏坦克大战. 在个游戏中,机器控制的坦克主要目标是射击敌方坦克并保卫自家的根据地.         游戏中坦克的动作空 ...

最新文章

  1. 把控制台程序嵌入到 WinForm 中执行
  2. opencv4.4.0函数手册_实战 MySQL8.0 窗口函数的巧妙应用
  3. (转)为什么人生气时说话用喊的?
  4. MFC子线程访问主线程对话框程序的控件对象
  5. 使用flex和bison实现的sql引擎解析
  6. Windows2003下DHCP服务器备份、还原、迁移、绑定
  7. 2019年,ALEXA将会走向何方?
  8. 计算机网络常见的无线传输有,第八讲 计算机网络基础.doc
  9. mysql调换数据_mysql互换表中两列数据方法
  10. 什么是张量(tensor)
  11. Java并发编程:线程的同步
  12. 2021日喀则市江孜高考成绩查询,2021西藏高考成绩查询时间 西藏高考成绩查询入口...
  13. 查纸张开数软件怎么样
  14. 如何写一个简单的爬虫程序
  15. AD转换的一个硬件实现原理
  16. java NIO网络编程
  17. 分页中PageSize和absolutepage详解
  18. SQL Server超详细使用教程——从安装到编写SQL语句
  19. SQL server数据库的操作步骤·Transact-SQL创建
  20. 微信小程序毕业设计——社区老人互助管理平台

热门文章

  1. 入选互联网名人堂的三位中国人
  2. python查询电脑序列号 CPU、主板、硬盘、MAC、BIOS
  3. 10大亮点解读--极通EWEBS4.0
  4. 尔雅 科学通史(吴国盛) 个人笔记及课后习题 2018 第七章 实验传统的兴起
  5. nginx1.21下载安装详细教程(win10)
  6. win11 恢复win10开始菜单及任务栏
  7. php vld解密zend,基于PHP7维护vld扩展的总结
  8. iMX6ULL上手体验
  9. 联想笔记本prtsc不能截图_Win10系统下怎么截屏
  10. 酒柜设计也可以很“特色”