作  者:郑莹,段庆洋,林利祥,游新宇,徐跃东,王新

摘  要近几年来,以深度强化学习(Deep Reinforcement Learning,DRL)为代表的人工智能技术被引入计算机网络系统设计中,促使网络领域走向数据驱动和智能化,并在典型的网络系统中不断取得新的突破。计算机网络应用的难点是难以对多变的网络环境进行复杂准确的建模,借助深度神经网络出色的特征提取能力,深度强化学习能够更好地以试错的方式探索更优的决策,并具有端到端的设计优势。首先阐述深度强化学习技术的原理,包括多种典型的深度学习中使用的神经网络结构、基于值函数和基于策略梯度的深度强化学习训练算法;之后详细分析了深度强化学习技术在计算机网络领域中解决资源调度问题的研究现状,包括任务调度、视频传输、路由选择、TCP拥塞控制以及网络缓存;最后给出了在计算机网络应用中使用深度强化学习仍存在的挑战。

关键词: 深度强化学习;计算机网络;任务调度;视频传输;路由选择;TCP拥塞控制;网络缓存

文献来源:郑莹,段庆洋,林利祥,等.深度强化学习在典型网络系统中的应用综述[J].无线电通信技术,2020,46(6):603-623.

doi:10.3969/j.issn.1003-3114.2020.06.001

点击这里阅读原文

电子网络发票应用系统网络不通_深度强化学习在典型网络系统中的应用综述相关推荐

  1. 乐器演奏_深度强化学习代理演奏的蛇

    乐器演奏 Ever since I watched the Netflix documentary AlphaGo, I have been fascinated by Reinforcement L ...

  2. 深度强化学习和强化学习_深度强化学习:从哪里开始

    深度强化学习和强化学习 by Jannes Klaas 简尼斯·克拉斯(Jannes Klaas) 深度强化学习:从哪里开始 (Deep reinforcement learning: where t ...

  3. dqn在训练过程中loss越来越大_深度强化学习——从DQN到DDPG

    想了解更多好玩的人工智能应用,请关注公众号"机器AI学习 数据AI挖掘","智能应用"菜单中包括:颜值检测.植物花卉识别.文字识别.人脸美妆等有趣的智能应用.. ...

  4. 第七章 深度强化学习-深度Q网络系列1(Deep Q-Networks,DQN)

    获取更多资讯,赶快关注上面的公众号吧! 文章目录 第七章 深度强化学习-深度Q网络 7.1 学习目标 7.2 深度学习和强化学习的区别 7.3 DQN原理 7.4 DQN算法 7.4.1 预处理 7. ...

  5. Nat. Mach. Intell. | 基于深度强化学习寻找网络中的关键节点

    今天给大家介绍哈佛大学Yang-Yu Liu课题组和加利福尼亚大学洛杉矶分校Yizhou Sun课题组发表在nature machine intelligence上的一篇文章"Finding ...

  6. 深度强化学习DQN网络

    DQN网络 DQN(Deep Q Networks)网络属于深度强化学习中的一种网络,它是深度学习与Q学习的结合,在传统的Q学习中,我们需要维护一张Q(s,a)表,在实际运用中,Q表往往是巨大的,并且 ...

  7. 深度强化学习引导的脑网络分析图神经网络

    https://www.sciencedirect.com/science/article/pii/S0893608022002507#fig1https://www.sciencedirect.co ...

  8. 综述—多智能体系统深度强化学习:挑战、解决方案和应用的回顾

    多智能体系统深度强化学习:挑战.解决方案和应用的回顾 摘要 介绍 背景:强化学习 前提 贝尔曼方程 RL方法 深度强化学习:单智能体 深度Q网络 DQN变体 深度强化学习:多智能体 挑战与解决方案 M ...

  9. 「对抗深度强化学习」是如何解决自动驾驶汽车系统中的「安全性」问题的?...

    原文来源:arXiv 作者:Aidin Ferdowsi. Ursula Challita.Walid Saad.Narayan B. Mandayam 「雷克世界」编译:嗯~是阿童木呀.KABUDA ...

最新文章

  1. android sqlite自定义函数,Android中自定义一个View的方法详解
  2. 智能合约从入门到精通:调用数据的布局和ABI
  3. 【计算机网络】传输层 : 总结 ( TCP / UDP 协议 | 寻址与端口 | UDP 协议 | TCP 协议特点 | TCP 连接释放 | TCP 流量控制 | TCP 拥塞控制 ) ★★★
  4. noclobber属性
  5. ruby + phantomjs 自动化测试 - GA
  6. PHP中问号?和冒号: 的作用
  7. PWM实现语音播放原理
  8. 怎么增加一个工位?ApiPost工位有什么用?
  9. 超越Excel,这才是报表的正确打开方式,可惜90%的人都没用过
  10. final修饰符,finally,finalize区别
  11. antd树型选择控件选择父级_element的tree树形菜单回显、父级半勾选
  12. 解决mysql编码问题_解决mysql乱码问题
  13. 麦本本从u盘启动计算机,麦本本怎么设计u盘启动顺序
  14. 第6-5课:五子棋游戏的相关算法
  15. 计算机管理-共享打印,打印机局域网共享怎么设置?最简单稳定的方法:一键共享...
  16. 教师管理系统_ER图_功能图_数据字典_数据库脚本
  17. libtorrent java_Libtorrent 之 NDK 编译
  18. becon帧 wifi_构造并发送Beacon帧以伪造任意WiFi热点
  19. codewars练习(javascript)-2021/2/18
  20. 入手评测 天玑1200和骁龙865对比哪个好

热门文章

  1. C++十进制转二进制
  2. [云炬小程序实战笔记] 第3章 云炬博客小程序全局配置
  3. 科大星云诗社动态20210217
  4. c语言使用数组计算最大数。_程序设计入门——C语言_浙江大学_第10次开课
  5. 串口通信模块1:串口基础知识
  6. Linux下修改命令提示符
  7. SQL Server数据库管理常用SQL和T-SQL语句
  8. Android Stdio 里的 SQLite数据库 刷新和保存
  9. 这些心智程序你安装了吗?
  10. 用双向链表实现一个栈