UC伯克利出品,深度强化学习最新课程已上线
点击上方,选择星标或置顶,不定期资源大放送!
阅读大概需要15分钟
Follow小博主,每天更新前沿干货
主题涵盖深度强化学习领域的方方面面,UC 伯克利 CS 285 2020 秋季课程视频放出。
当地时间 10 月 11 日,UC 伯克利电气工程与计算机科学系(EECS)助理教授 Sergey Levine 在推特上宣布,他讲授的 CS285 深度强化学习(RL)课程已经放出了部分视频,并表示之后每周会实时更新后续课程。
这门课程共有 21 节,目前已放出了前 12 节课程的视频,每节课程被分割为 4 至 6 个短视频,视频长度不等,目前共计有 55 个视频:
视频地址:https://www.youtube.com/playlist?list=PL_iWQOsE6TfURIIhCrlt-wj9ByIVpbfGc
这门课程由 UC 伯克利电气工程与计算机科学系推出,主要介绍了深度强化学习领域的不同主题。在 21 节课程中,Sergey Levine 主要讲述了行为监督学习、TensorFlow 和神经网络知识回顾、强化学习综述、策略梯度、Actor-Critic 算法、价值函数方法、带有 Q 函数的深度 RL、高级策略梯度、基于模型的规划、强化学习和策略学习、逆强化学习、迁移学习与多任务学习、分布式 RL、元学习和信息论等主题。
这门课旨在为学生提供基础知识,以了解深度强化学习算法。此外,在课程工作人员的帮助下,学生还将获得进行最终研究级项目的机会。具体而言,该课程将提供几种常用强化学习算法的实践经验,并为学生讲述高级深度强化学习主题的概述,以及当前该领域的研究趋势。
对于 Sergey Levine 的这门课程,有网友表示,UC 伯克利的 RL 课程对于该领域学习者而言是非常棒的学习资源。
讲师介绍
本系列课程的讲师是来自加州大学伯克利分校电气工程与计算机科学系的助理教授 Sergey Levine。他的研究主要集中在控制与机器学习之间的交叉融合,旨在开发能够使机器具有自主掌握执行复杂任务技能的算法和技术。Sergey Levine 对如何将学习用于掌握复杂的行为技能上格外感兴趣,以便让机器更自主更智能。
Sergey Levine 于 2009 年获得斯坦福大学计算机科学学士和硕士学位,并于 2014 年继续获得斯坦福大学计算机科学博士学位。他于 2016 年秋季加入加州大学伯克利分校电气工程与计算机科学系,主要研究用于决策和控制的机器学习,重点是深度学习和强化学习算法。在谷歌学术主页上,Sergey Levine 所著论文的被引用次数已经达到了 31000 以上。
Sergey Levine 的研究应用包括自主机器人和自动驾驶汽车,以及计算机视觉和计算机图形学。研究内容包括开发将感知和控制相结合的深度神经网络策略的端到端训练算法、用于逆强化学习的可扩展算法、深度强化学习算法等。Sergey Levine 的研究曾被纽约时报、BBC、MIT 科技评论、彭博社等知名媒体报道。
参考链接:
http://rail.eecs.berkeley.edu/deeprlcourse/
https://www2.eecs.berkeley.edu/Courses/CS285/
重磅!DLer-强化学习交流群已成立!
欢迎各位RLer加入强化学习微信交流大群,本群旨在交流强化学习框架、策略梯度、DQN、理论推导与算法实现、前沿技术与顶会文章解读、应用场景等内容。更有求职内推、算法竞赛、资源干货、业界前沿资讯等,欢迎加群交流学习!
进群请备注:研究方向+学校/公司+昵称(如强化学习+上交+王明)
广告商、博主请绕道!
???? 长按识别,即可进群!
UC伯克利出品,深度强化学习最新课程已上线相关推荐
- 李宏毅深度强化学习(国语)课程(2018) 笔记(二)Proximal Policy Optimization(PPO)
李宏毅深度强化学习(国语)课程(2018)_哔哩哔哩_bilibili on-policy:要learn的agent和环境互动的agent是同一个,即agent一边跟环境互动,一边学习: off-po ...
- 李宏毅深度强化学习(国语)课程(2018) 笔记(一)Policy Gradient (Review)
李宏毅深度强化学习(国语)课程(2018) https://www.bilibili.com/video/BV1MW411w79n?spm_id_from=333.337.search-card.al ...
- 李宏毅深度强化学习(国语)课程(2018) 笔记(八)Imitation Learning
李宏毅深度强化学习(国语)课程(2018) 李宏毅深度强化学习(国语)课程(2018)_哔哩哔哩_bilibili 机器是可以与环境进行交互的,但是大部分情况下,机器却不能从这个过程 ...
- 《强化学习周刊》第26期:UCL UC Berkeley发表深度强化学习中的泛化研究综述、JHU推出基于强化学习的人工决策模型...
No.26 智源社区 强化学习组 强 化 学 习 研究 观点 资源 活动 关于周刊 强化学习作为人工智能领域研究热点之一,其研究进展与成果也引发了众多关注.为帮助研究与工程人员了解该领域的相关进展和 ...
- DeepMind联合UCL,推出2021强化学习最新课程!
欢迎关注,专注学术论文.机器学习.人工智能.Python技巧 DeepMind 作为全球顶级 AI 研究机构,自 2010 年创建以来已有多项世界瞩目的研究成果,例如击败世界顶级围棋玩家的 Alpha ...
- AI绘画发展史(伪):从免费到吃屎;YSDA·自然语言处理课程8K Star;伯克利CS285·深度强化学习课程;前沿论文 | ShowMeAI资讯日报
- 深度强化学习(资源篇)(更新于2020.11.22)
理论 1种策略就能控制多类模型,华人大二学生提出RL泛化方法,LeCun认可转发 | ICML 2020 AlphaGo原来是这样运行的,一文详解多智能体强化学习的基础和应用 [DeepMind总结] ...
- 深度强化学习入门到精通--资料综述
关注上方"深度学习技术前沿",选择"星标公众号", 资源干货,第一时间送达! 人工智能是21世纪最激动人心的技术之一.人工智能,就是像人一样的智能,而人的智能包 ...
- 【大全】深度强化学习入门到精通
聚焦AI干货,关注:决策智能与机器学习 人工智能是21世纪最激动人心的技术之一.人工智能,就是像人一样的智能,而人的智能包括感知.决策和认知(从直觉到推理.规划.意识等).其中,感知解决what,深度 ...
最新文章
- 中科大硬核“毕业证”:“一生一芯”计划下,5位本科生带自研芯片毕业
- Zabbix-03-3 告警变量值
- 5.1 指针与地址 (C)
- 设计模式之:适配器模式
- 世界上公认最难的十大学科
- ASP.NET 动态输出Javascript 文本格式换行问题 [ASP.NET | C# | Response]
- Seaborn——绘制统计图形
- Php底层深度探索(2)---Apache运行机制剖析 王泽宾
- linux服务器无法登录,linux服务器账号密码正确无法登录-Go语言中文社区
- Linux中,Tomcat安装
- JNI学习-- C调用java方法
- H5页面在自己APP中图标显示正常,接入钉钉请求.woff图标字体报错
- Matlab 保存TXT文件 打开乱码 (解决)
- HDU5773(The All-purpose Zero LIS变形)
- 第53天-代码审计-TP5 框架及无框架变量覆盖反序列化(待续)
- 考研数据结构之队列(3.3)——练习题之设以数组Q.elems[maxSize]存储循环队列的元素,同时以Q.rear和Q.length分别指示循环队列中的队尾位置和队列中所含元素的个数(C表示)
- dcos universe
- 社招简历老被拒?大佬告诉你面试官只中意这些简历,快来看看吧!
- 惠普暗影精灵4P拆机换风扇
- 腾讯云API与国家气象局API获取实时天气