基于深度强化学习的智能车间调度方法研究
摘要:
工业物联网的空前繁荣为传统的工业生产制造模式开辟了一条新的道路。智能车间调度是整个生产过程实现全面控制和柔性生产的关键技术之一,要求以最大完工时间最小化分派多道工序和多台机器的生产调度。首先,将车间调度问题定义为马尔可夫决策过程,建立了一个基于指针网络的车间调度模型。其次,将作业调度过程看作是从一个序列到另一个序列的映射,提出了一种基于深度强化学习的车间调度算法。通过分析模型在不同参数设置下的收敛性,确定了最优参数。在不同规模的公共数据集和实际生产数据集上的实验结果表明,所提出的深度强化学习算法能够取得更好的性能。
关键词: 工业物联网 ; 智能车间调度 ; 柔性生产 ; 深度强化学习 ; 车间调度方法
0 引言
工业物联网(IIoT, industrial internet of things)作为新一代信息技术与制造业深度融合的产物,通过实现人、机、物的全面互联,为传统的工业生产制造模式开辟了一条新的道路。IIoT中设想的智能车间如图1所示,采用“云-边-端”3层架构,终端各种类型的传感设备综合感知实时生产数据,并通过无线传感器网络实时传输到边缘服务器,在边缘端使用云端训练好的车间调度模型结合订单、物料等系统,对等待生产的作业进行快速排产调度,然后将调度结果通过生产指令的方式下发到生产线执行,以实现整个生产过程的自动化、智能化、无人化。图1 中虚线表示从下层到上层(如端到边、边到云)的数据传输,实线表示从上层到下层的数据传输。显然,在云服务器中利用不断获取的新数据定期训练更新的车间调度模型决定了整个生产计划的性能,能直接影响生产效率,但是现有的车间调度方法还不能很好地满足IIoT的愿景。因此,设计一种高效、智能的车间调度方法具有重要的紧迫性和现实意义。
基于深度强化学习的智能车间调度方法研究相关推荐
- 基于深度强化学习的智能船舶航迹跟踪控制
基于深度强化学习的智能船舶航迹跟踪控制 人工智能技术与咨询 昨天 本文来自<中国舰船研究> ,作者祝亢等 关注微信公众号:人工智能技术与咨询.了解更多咨询! 0. 引 言 目前,国内外 ...
- 基于深度强化学习的智能汽车决策模型
1.基于深度强化学习的智能汽车决策模型 以神经网络为核心的智能体最主要的优势在于其依靠大量的数据自主学习的能力,通过数据驱动智能体可以应对各种未经历过的复杂环境.强化学习是一种经典的智能系统设计方案, ...
- 商简智能学术成果|基于深度强化学习的联想电脑制造调度(Lenovo Schedules Laptop Manufacturing Using Deep Reinforcement Learning)
获取更多资讯,赶快关注上面的公众号吧! 文章目录 摘要 背景介绍 传统方法无法解决现有挑战 解决方案 提升模型表达能力 针对复杂约束的掩码机制 快速模型训练 配置多目标调度优化 结论 本篇论文作为 ...
- 论文研读——基于深度强化学习的自动驾驶汽车运动规划研究综述
论文研读--Survey of Deep Reinforcement Learning for Motion Planning of Autonomous V ehicles 此篇文章为论文的学习笔记 ...
- 基于深度对抗学习的智能模糊数据生成方法
目录 第一节 介绍: 第二节:相关工作 第三节:背景 A.深度学习 B.生成对抗网 C.WGAN 第四节 模糊系统设计 A.概述 1)数据帧预处理 2)对抗训练 3)模糊测试和再培训 B.数据帧预处理 ...
- 通过图注意力神经网络进行多智能体游戏抽象_[读论文] AttnPath: 将图注意力机制融入基于深度强化学习的知识图谱推理中...
论文原文:Incorporating Graph Attention Mechanism into Knowledge Graph Reasoning Based on Deep Reinforcem ...
- ICCV 2019 | 旷视研究院推出基于深度强化学习的绘画智能体
两年一度的国际计算机视觉大会 ICCV 2019 ( IEEE International Conference on Computer Vision) 将于当地时间 10 月 27 至 11 月 2 ...
- 基于深度强化学习训练《街头霸王·二:冠军特别版》通关关底 BOSS -智能 AI 代理项目上手
文章目录 SFighterAI项目简介 实现软件环境 项目文件结构 运行指南 环境配置 验证及调整gym环境: gym-retro 游戏文件夹 错误提示及解决 Could not initialize ...
- 时空AI技术:深度强化学习在智能城市领域应时空AI技术:深度强化学习在智能城市领域应用介绍...
来源:海豚数据科学实验室 作者:京东科技 时空AI团队 深度强化学习是近年来热起来的一项技术.深度强化学习的控制与决策流程必须包含状态,动作,奖励是三要素.在建模过程中,智能体根据环境的当前状态信息输 ...
最新文章
- mysql online ddl和pt_MySQL的onlineDDL及pt-osc
- find命令过滤 no such_运维老手常用的linux命令操作
- 前端学习(1569):todoMVC准备工作
- 关于发布WP 8.1应用信息不匹配问题的解决办法
- Runner站立会议03
- visio2016 数据库模型图_数据库相关术语整理
- editplus软件下载地址
- CodeWarrior IDE烧写介绍
- java queue GATK_gatk4使用总结
- python基础编程小实例11——房贷计算器
- 中序和后序构建二叉树
- 个人作业4 结对开发地铁
- BlueKing3-作业平台
- Excel如何将姓名转为拼音并将姓和名分开显示
- SCons教程(3) 编译程序
- 最细RGB颜色表,建议收藏
- Android动画详解之Android 动画属性和实现方法之帧动画(二)
- React 使用Markdown 更改样式
- sybase ASE在unixlinux上的自动备份脚本
- 西电研究生毕业论文latex模板使用指南
热门文章
- 【动态 | 哈希未来获得节点资本战略投资】
- 4.2 蓝牙 还不错的原创分析系列
- vue微信公众号授权开发流程
- vue通过事件触发CSS3动画
- 【Web】Monit监控程序使用
- /var/lib/docker/overlay2 占用很大,清理Docker占用的磁盘空间,迁移 /var/lib/docker 目录
- 浏览器插件开发-manifest文件解读
- Linux入门--基于VM-Centos7
- Web报表系统葡萄城报表:报表系统
- mysql2ora datacopy,Oracle 11gR2 使用 RMAN duplicate from active database 复制数据库