基于深度强化学习的智能车间调度方法研究

摘要:

工业物联网的空前繁荣为传统的工业生产制造模式开辟了一条新的道路。智能车间调度是整个生产过程实现全面控制和柔性生产的关键技术之一，要求以最大完工时间最小化分派多道工序和多台机器的生产调度。首先，将车间调度问题定义为马尔可夫决策过程，建立了一个基于指针网络的车间调度模型。其次，将作业调度过程看作是从一个序列到另一个序列的映射，提出了一种基于深度强化学习的车间调度算法。通过分析模型在不同参数设置下的收敛性，确定了最优参数。在不同规模的公共数据集和实际生产数据集上的实验结果表明，所提出的深度强化学习算法能够取得更好的性能。

关键词：工业物联网 ; 智能车间调度 ; 柔性生产 ; 深度强化学习 ; 车间调度方法

0 引言

工业物联网（IIoT, industrial internet of things）作为新一代信息技术与制造业深度融合的产物，通过实现人、机、物的全面互联，为传统的工业生产制造模式开辟了一条新的道路。IIoT中设想的智能车间如图1所示，采用“云-边-端”3层架构，终端各种类型的传感设备综合感知实时生产数据，并通过无线传感器网络实时传输到边缘服务器，在边缘端使用云端训练好的车间调度模型结合订单、物料等系统，对等待生产的作业进行快速排产调度，然后将调度结果通过生产指令的方式下发到生产线执行，以实现整个生产过程的自动化、智能化、无人化。图1 中虚线表示从下层到上层（如端到边、边到云）的数据传输，实线表示从上层到下层的数据传输。显然，在云服务器中利用不断获取的新数据定期训练更新的车间调度模型决定了整个生产计划的性能，能直接影响生产效率，但是现有的车间调度方法还不能很好地满足IIoT的愿景。因此，设计一种高效、智能的车间调度方法具有重要的紧迫性和现实意义。

基于深度强化学习的智能车间调度方法研究相关推荐

基于深度强化学习的智能船舶航迹跟踪控制
基于深度强化学习的智能船舶航迹跟踪控制人工智能技术与咨询昨天本文来自<中国舰船研究> ,作者祝亢等关注微信公众号:人工智能技术与咨询.了解更多咨询! 0. 引言目前,国内外 ...
基于深度强化学习的智能汽车决策模型
1.基于深度强化学习的智能汽车决策模型以神经网络为核心的智能体最主要的优势在于其依靠大量的数据自主学习的能力,通过数据驱动智能体可以应对各种未经历过的复杂环境.强化学习是一种经典的智能系统设计方案, ...
商简智能学术成果|基于深度强化学习的联想电脑制造调度（Lenovo Schedules Laptop Manufacturing Using Deep Reinforcement Learning）
获取更多资讯,赶快关注上面的公众号吧! 文章目录摘要背景介绍传统方法无法解决现有挑战解决方案提升模型表达能力针对复杂约束的掩码机制快速模型训练配置多目标调度优化结论本篇论文作为 ...
论文研读——基于深度强化学习的自动驾驶汽车运动规划研究综述
论文研读--Survey of Deep Reinforcement Learning for Motion Planning of Autonomous V ehicles 此篇文章为论文的学习笔记 ...
基于深度对抗学习的智能模糊数据生成方法
目录第一节介绍: 第二节:相关工作第三节:背景 A.深度学习 B.生成对抗网 C.WGAN 第四节模糊系统设计 A.概述 1)数据帧预处理 2)对抗训练 3)模糊测试和再培训 B.数据帧预处理 ...
通过图注意力神经网络进行多智能体游戏抽象_[读论文] AttnPath: 将图注意力机制融入基于深度强化学习的知识图谱推理中...
论文原文:Incorporating Graph Attention Mechanism into Knowledge Graph Reasoning Based on Deep Reinforcem ...
ICCV 2019 | 旷视研究院推出基于深度强化学习的绘画智能体
两年一度的国际计算机视觉大会 ICCV 2019 ( IEEE International Conference on Computer Vision) 将于当地时间 10 月 27 至 11 月 2 ...
基于深度强化学习训练《街头霸王·二：冠军特别版》通关关底 BOSS -智能 AI 代理项目上手
文章目录 SFighterAI项目简介实现软件环境项目文件结构运行指南环境配置验证及调整gym环境: gym-retro 游戏文件夹错误提示及解决 Could not initialize ...
时空AI技术：深度强化学习在智能城市领域应时空AI技术：深度强化学习在智能城市领域应用介绍...
来源:海豚数据科学实验室作者:京东科技时空AI团队深度强化学习是近年来热起来的一项技术.深度强化学习的控制与决策流程必须包含状态,动作,奖励是三要素.在建模过程中,智能体根据环境的当前状态信息输 ...

基于深度强化学习的智能车间调度方法研究

0 引言

基于深度强化学习的智能车间调度方法研究相关推荐

最新文章

热门文章