matlab 陈学松,基于强化学习的空调系统运行优化OPTIMIZATIONOF-同济大学.PDF

基于强化学习的空调系统运行优化OPTIMIZATIONOF-同济大学

基于强化学习的空调系统运行优化

王尉同 1 潘毅群 1 黄治钟 2

(同济大学机械与能源工程学院，上海 201804

2 同济大学中德工程学院，上海 201804)

摘要：空调系统运行优化是建筑节能的重要组成部分。本文将强化学习算法应用在空调系

统运行优化中。首先建立空调系统运行优化任务的马尔科夫决策过程模型，接下来确立规

则对探索空间进行进一步缩减，使探索过程尽可能满足系统设备运行和被控区域舒适度的

约束，最后应用 Q-Learning 算法探索学习不断改进控制策略。通过仿真案例对算法进行了

测试。采用动态仿真软件 TRNSYS 和 MATLAB 进行联合仿真，对被控区域送风量进行了

优化，仿真结果显示，与基于固定规则的控制策略和 PID 控制相比，本文提出的基于强化

学习的控制方法可以在小幅提升被控区域舒适度的同时可将运行费用分别降低超过 7%和

4.5% 。

关键词：空调系统；运行优化；强化学习；Q-Learning

OPTIMIZATION OF HVAC SYSTEM

OPERATION BASED ON

REINFORCEMENT LEARNING

Abstract: The operation optimization of HVAC system is an essential part of building energy

conservation. In this work, reinforcement learning technique is applied to optimize HVAC system

operation. Firstly, we formulate the HVAC system operation as a Markov decision process.

Secondly, rules are defined to shrinkage the exploration space in order to avoid violating equipment

operation constraints and conditioned zones comfort constraints during exploration. Finally, Q-

Learning algorithm is deployed to improve the control strategy through interacting with the

environment. This study tests the algorithm by a simulation case. Dynamic simulation program

TRNSYS and MATLAB are utilized to conduct co-simulation. Results show that, compared with

fixed rule-based control strategy and PID controller, reinforcement learning controller can reduce

energy cost by over 7% and 4.5% separately by adjusting supply air flow rate, and at the same time

improve occupants comfort level slightly.

Keywords: HVAC system; operation optimization; reinforcement learning; Q-Learning

0. 引言

空调系统运行优化是建筑节能的重要组成部分。建筑运行优化的基本目标是在满足被

控区域舒适度要求的前提下尽可能的降低能耗或者能耗消费。为了适应室外不断变化的天

气情况和室内负荷变化情况，如何动态调整系统中的设定值或者运行规则从而提高建筑能

效一直是建筑运行优化的研究重点。

经典控制器包括基于规则的控制(如启停控制)，PID 控制等由于结构简单，初投资较

低被广泛应用，然而空调系统是典型的高度非线性、不确定性、时变性、耦合性的复杂系

matlab 陈学松,基于强化学习的空调系统运行优化OPTIMIZATIONOF-同济大学.PDF相关推荐

使用MATLAB/simulink与PreScan联合进行基于强化学习的自动驾驶系统设计与仿真
使用MATLAB/simulink与PreScan联合进行基于强化学习的自动驾驶系统设计与仿真总论环境配置系统搭建总论使用MATLAB中的强化学习工具箱作为核心算法的建立工具,在simuli ...
《强化学习周刊》第26期：UCL UC Berkeley发表深度强化学习中的泛化研究综述、JHU推出基于强化学习的人工决策模型...
No.26 智源社区强化学习组强化学习研究观点资源活动关于周刊强化学习作为人工智能领域研究热点之一,其研究进展与成果也引发了众多关注.为帮助研究与工程人员了解该领域的相关进展和 ...
dncnn图像去噪_基于强化学习的图像去噪方法与流程
本发明属于图像处理技术领域,涉及一种基于机器学习技术,采用强化学习去除图像噪声的方法. 背景技术: 随着计算机技术的发展,人们对于图像质量的要求越来越高.但是,由于环境或拍摄设备等因素,能够获得图像通 ...
【DeepExploit】基于强化学习的自动渗透工具
文章目录 1. 研究背景 1.1 自动化渗透测试研究背景 1.2 DeepExploit简介 1.3 Metasploit简介 1.3.1 Metasploit渗透步骤--以MS17-010为例 1. ...
【强化学习与机器人控制论文 2】基于强化学习的五指灵巧手操作
基于强化学习的五指灵巧手操作 1. 引言 2. 论文解读 2.1 背景 2.2 论文中所用到的强化学习方法 2.3 实验任务和系统 2.4 仿真到实物的迁移 2.5 分布式RL训练--从状态中学到控制 ...
[论文]基于强化学习的无模型水下机器人深度控制
基于强化学习的无模型水下机器人深度控制摘要介绍问题公式 A.水下机器人的坐标框架 B.深度控制问题马尔科夫模型 A.马尔科夫决策 B.恒定深度控制MDP C.弯曲深度控制MDP D.海底追踪的 ...
强化学习3——基于强化学习的四足机器人运动控制
一.问题描述传统的机器人行走控制如图1所示. 图1 传统机器人运动控制框图包括三个环:平衡控制.运动轨迹控制.电机控制.传统的控制需要利用外部的视觉信号以及机器人的传感器获取环境及自身的状态信息, ...
基于强化学习的多战机同SEAD联合作战空战辅助决策(改进版)
基于强化学习的多战机同SEAD联合作战空战辅助决策(改进版) 1.基础知识这部分的基础知识可以参考以前的博文:基于强化学习的多战机同SEAD联合作战空战辅助决策 2.之前的工作之前运用强化学习的知 ...
【强化学习与机器人控制论文 3】基于强化学习的五指灵巧手玩转魔方
这里写目录标题 1. 引言 2. 论文解读 2.1 背景 2.2 硬件平台和仿真平台的搭建 2.3 主要算法框架 2.4 自动域随机化ADR 2.5 实验结果 3. 总结 1. 引言本文介绍一篇Op ...
基于强化学习的坦克大战python语言实现
这个项目是基于一个人工智能算法(基于全连接线性BP网络的增强学习模型)代理玩经典游戏坦克大战. 在个游戏中,机器控制的坦克主要目标是射击敌方坦克并保卫自家的根据地. 游戏中坦克的动作空 ...

matlab 陈学松,基于强化学习的空调系统运行优化OPTIMIZATIONOF-同济大学.PDF

matlab 陈学松,基于强化学习的空调系统运行优化OPTIMIZATIONOF-同济大学.PDF相关推荐

最新文章

热门文章