文末有数据派赠票福利呦!


深度强化学习是人工智能领域的一个新的研究热点。它以一种通用的形式将深度学习的感知能力与强化学习的决策能力相结合,并能够通过端对端的学习方式实现从原始输入到输出的直接控制。自提出以来,在许多需要感知高维度原始输入数据和决策控制的任务中,深度强化学习方法已经取得了实质性的突破。

本期CCF YOCSEF专题探索报告会“深度强化学习的理论、算法与应用”邀请到了机器学习和大数据挖掘等领域重量级的专家学者做主题报告,就强化学习理论及应用进行学术探讨,同时邀请工业界专家分享强化学习在现实场景中的应用多智能体计算的几个应用。具体可围绕强化学习与深度学习的前沿探讨,深度强化学习的主要算法,Alpha Go-深度强化学习应用例解,多智能体强化学习与智能驾驶应用进展,以及深度强化学习在游戏,机器人,自然语言处理等领域的应用进展展开。我们期望本次论坛能够有效推动深度强化学习技术的发展,增进领域学者间的交流与互动,使参加者在了解学科专题基础、提高理论水平的同时,掌握本领域最新技术动态,了解未来技术趋势。

【时间】7月29日9:00-17:20
【地点】北京中科院计算所,一层/四层报告厅(暂定)

【流程】

08:00--09:00      签到

09:00--09:10      开幕式

09:10--09:20      合影

09:20--10:20      强化学习在滴滴的探索与实践  (叶杰平)

10:20--10:40      茶歇

10:40--11:40  Towards robust and efficient Reinforcement learning  (秦涛)

13:30--14:30      自然语言处理和搜索中的深度强化学习应用   (黄民烈)

14:30--15:30  Interpretable Machine Learning Models via Neural Interaction Detection   (刘燕)

15:30--15:50      茶歇

15:50--16:50      端到端事件感知-决策的深度策略梯度方法   (邓志东)

16:50--17:20      总结&闭幕式

【嘉宾介绍】


特邀讲者:叶杰平(滴滴副总裁、AI Labs主任、首席科学家)


简介:滴滴副总裁、AI Labs主任、首席科学家,美国密西根大学终身教授及密西根大学大数据研究中心管理委员。叶杰平是机器学习领域国际领军人物,主要从事机器学习,数据挖掘和大数据分析领域的研究,尤其在大规模稀疏模型学习中处于国际领先地位。曾担任包括IEEETPAMI,DMKD,IEEETKDE,NIPS,ICML,KDD等多个国际顶级期刊编委及国际顶级会议程序委员会主席和领域主席。2010年获得美国国家自然科学基金会生涯奖(NSF CAREER Award),2013年获得KDD最佳学生论文奖。

特邀讲者:秦涛(微软亚洲研究院资深研究员/经理)


简介:秦涛博士,微软亚洲研究院资深研究员/经理,中国科学技术大学博士生导师。主要研究领域包括机器学习和人工智能(深度学习和强化学习的算法设计、理论分析及在实际问题中的应用),互联网搜索与计算广告,博弈论和多智能体系统,在国际会议和期刊上发表学术论文100余篇。曾任SIGIR、ACML、AAMAS领域主席,担任多个国际学术大会程序委员会成员,包括ICML、NIPS、KDD、IJCAI、AAAI、WSDM、EC、SIGIR、AAMAS、WINE,曾任多个国际学术研讨会联合主席。获得《北京青年》2017年度年度“工匠精神·青年榜样”奖。

特邀讲者:黄民烈(清华大学副教授,清华大学计算机系人工智能实验室副主任)


简介:黄民烈,清华大学计算机系副教授,博士生导师,计算机系人工智能研究所副所长。研究兴趣主要集中在人工智能、深度学习、强化学习,自然语言处理如自动问答、人机对话系统、情感与情绪智能等。已超过60篇CCF A/B类论文发表在ACL、IJCAI等国际顶级和主流会议及期刊上。曾担任多个国际顶级会议的领域主席或高级程序委员。 。

特邀讲者:刘燕( 滴滴AI Labs时空序列首席科学家,南加州大学计算机系终身教授)


简介:滴滴AI Labs时空序列首席科学家,南加州大学计算机系终身教授、机器学习中心主任。她在卡内基梅隆大学获得计算机硕士及博士学位。2006年-2010年在IBM研究院担任研究员。她的主要研究项目是时间序列和时空序列数据的分析与学习,曾经多次组织该课题的研讨会和邀请讲座。研究成果被广泛应用到交通预测、医疗、环境、智能生产和其他领域中。她曾经获得美国国家科学基金会奖、大川基础研究奖、ACM论文奖荣誉奖(全球计算机博士论文最高奖项)、暹罗数据挖掘国际会议最佳论文奖,以及雅虎、IBM、Facebook学院奖。

特邀讲者:邓志东(清华大学教授)


简介:邓志东,清华大学计算机系长聘教授,博士生导师。现为中国人工智能产业创新联盟专家委主任委员, 新兴产业百人会专家等。1992年-1994年在清华大学计算机系从事人工神经网络与强化学习的博士后研究。1996年-1997年在香港理工大学合作研究一年(对方聘用)。2001年-2003年在美国华盛顿大学,作为客座教授合作研究两年(对方聘用),期间曾参加美国DARPA和NSF项目。先后主持或参与973课题等国家级重点科研项目30余项。发表论文250余篇,参编教材或专著5本。目前的研究方向包括:人工智能(深度神经网络、深度强化学习)、计算神经科学、无人驾驶汽车、先进机器人等。

执行主席: 唐 杰(长聘副教授、清华大学计算机系副主任)


简介:CCF YOCSEF 学术委员会主席、CCF杰出会员、杰出演讲者。清华-工程院知识智能联合实验室主任。研究兴趣包括:社会网络分析、数据挖掘和知识图谱。发表论文200余篇,引用10000多次(个人h-指数52)。获北京市科技进步一等奖、人工智能学会科技进步一等奖、首届优青和CCF青年科学家奖等。

执行主席: 吴国斌(科技合作总监,滴滴出行)


简介:CCF YOCSEF学术委员会学术秘书、CCF-滴滴大数据联合实验室学术委员会委员。现任滴滴出行科技合作总监,大数据分析与应用技术国家工程实验室副主任,曾任职微软亚洲研究院。

【常规报名】

扫描下方二维码报名

参会提示:

建议先加入CCF,以会员价参会。


扫码成为CCF 会员

住宿信息:

学员住宿需要自己预订,费用自理。

物科宾馆:010-8264 9140

科苑公寓:010-8262 8538

骏马国际酒店:010-8288 5858


  数据派福利  

数据派作为数据院的官方公众号,为大家放送4个免费参会名额~

以下人群优先通过:

  • 数据派专栏作者

  • 数据派志愿者

  • 清华校内师生

  • 周边高校师生

  • 其他背景与课程相关性较强的数据派读者

扫描下方二维码或点击阅读原文申请免费赠票~

点击“阅读原文”申请赠票

赠票 | 深度强化学习的理论、算法与应用专题探索班相关推荐

  1. 线下报名 | YOCSEF TDS:深度强化学习的理论、算法与应用

    时间:7月29日9:00-17:20 地点:北京中科院计算所,一层/四层报告厅(暂定) 报名方式:1.报名链接:http://conf2.ccf.org.cn/TDS  2.点击文末阅读原文报名  3 ...

  2. 深度强化学习-Double DQN算法原理与代码

    深度强化学习-Double DQN算法原理与代码 引言 1 DDQN算法简介 2 DDQN算法原理 3 DDQN算法伪代码 4 仿真验证 引言 Double Deep Q Network(DDQN)是 ...

  3. 论坛报名 | 从捉迷藏、星际争霸到新一代人工智能:多智能体深度强化学习的理论与实践...

    与6位图灵奖得主和100多位专家 共同探讨人工智能的下一个十年 长按图片或点击阅读原文,内行盛会,首次免费注册 2020年6月21-24日,第二届北京智源大会(官网:https://2020.baai ...

  4. 【深度强化学习】DRL算法实现pytorch

    DRL Algorithms DQN (deep Q network) Policiy_Gradient 策略梯度是强化学习的一类方法,大致的原理是使用神经网络构造一个策略网络,输入是状态,输出为动作 ...

  5. 【深度强化学习】DDPG算法

    1 DDPG简介 确定性策略梯度(Deterministic Policy Gradient,DPG):确定性策略是和随机策略相对而言的.作为随机策略,在同一个状态处,采用的动作是基于一个概率分布,即 ...

  6. 深度强化学习Soft-Actor Critic算法高性能Pytorch代码(改写自spinningup,低环境依赖,低阅读障碍)

    写在前面 DRL各种算法在github上各处都是,例如莫凡的DRL代码.ElegantDRL(易读性NO.1) 很多代码不是原算法的最佳实现,在具体实现细节上也存在差异,不建议直接用在科研上. 这篇博 ...

  7. 深度强化学习:基于Python的理论及实践(英文版)

    深度强化学习结合了深度学习和强化学习,使人工智能体能够在没有监督的情况下学习如何解决顺序决策问题.在过去的十年中,深度强化学习在一系列问题上取得了显著的成果,涵盖从单机游戏和多人游戏到机器人技术等方方 ...

  8. 深度学习学习笔记-论文研读4-基于深度强化学习的多用户边缘计算任务卸载调度与资源分配算法

    本人学识浅薄,如有理解不到位的地方还请大佬们指出,相互学习,共同进步 概念引入 强化学习 DQN算法 边缘计算 边缘计算,是指在靠近物或数据源头的一侧,采用网络.计算.存储.应用核心能力为一体的开放平 ...

  9. 深度强化学习之gym扫地机器人环境的搭建(持续更新算法,附源码,python实现)

    想要源码可以点赞关注收藏后评论区留下QQ邮箱 本次利用gym搭建一个扫地机器人环境,描述如下: 在一个5×5的扫地机器人环境中,有一个垃圾和一个充电桩,到达[5,4]即图标19处机器人捡到垃圾,并结束 ...

最新文章

  1. 基于koa2操作mysql封装例子
  2. c/c++ ide clion安装编译器
  3. 【Java面试题】docker拉取镜像
  4. 电路与电子学-第一章直流电路分析方法小概括
  5. 【codevs 1315】1315 摆花2012年NOIP全国联赛普及组(dp)
  6. 记录 之 tensorflow常见的数据预处理操作
  7. Android自动化测试之MonkeyRunner录制和回放脚本
  8. 实时音视频技术的演进与应用
  9. yum 快速安装 LAMP
  10. week03_python标准库datetime
  11. MSDN Library Visual Studio6.0 简体中文版下载及安装
  12. dsoframer.ocx java_DSOFramer.ocx 控件使用
  13. android wifi检测呼吸,WiFi已经逆天了 现在能检测到你的呼吸
  14. 数学分析教程(科大)——3.3笔记+习题
  15. 60个经典的电脑技巧!每一个都超实用!
  16. mysql安装创建数据库_mysql 安装创建数据库
  17. 内存超频时序怎么调_憋了很久的问题:内存时序有什么用?超频时怎么调?
  18. html中放大镜字体图标,CSS3 放大镜应用图标
  19. SAP WRITE设置列表颜色 页眉页尾输出控制
  20. python 3 日历模块

热门文章

  1. 电商618背后的那些技术事儿
  2. 鴻雁 Anser cygnoides
  3. 宿主如何访问虚拟机中的web服务器
  4. 深入解析和反思携程宕机事件
  5. SWIG和PInvoke学习(1)
  6. 阿里云代码超限2040M remote: error: hook declined to update refs/heads
  7. 单实例的写法最保险的写法应采用静态方式的预生成 ,不要用双重检查的懒汉模式等,JDK1.6之后加了volatile也要谨慎,需要考证是否解决这个问题
  8. MYSQL因为索引问题导致的死锁分析
  9. python中元组tuple官方使用手册
  10. SQL2005 BCP