斯坦福2019强化学习课程完结,讲义、PPT、视频已提供下载
晓查 发自 凹非寺
量子位 出品 | 公众号 QbitAI
斯坦福大学AI课程资源接二连三开始更新。上周NLP课程才结束,这周强化学习(RL)课程也已全部完结。
现在,强化学习课程讲义、PPT可以在官网下载,第一部分的课程已上传至YouTube。
本课程主讲人是斯坦福大学的助理教授Emma Brunskill。她2009年从MIT博士毕业,现在是斯坦福统计机器小组成员,2012年曾入选微软研究院Fellow。
Emma教授的主要研究方向是高风险场景下的强化学习:当获取经验的成本和风险很高时,智能体如何从经验中学习并做出正确的决策。实际应用包括教育软件、医疗决策、机器人等。
课程内容
斯坦福大学今年的RL课程从1月7日开始,每周2节课,共持续10周,到今年3月13日结课。
课程内容主要有:强化学习入门、学习评估策略、函数近似、大空间中的模仿学习、策略搜索、元学习、批量强化学习等等。
Emma教授给学生制定了这些目标:
定义强化学习的关键特征,并将其与非交互式的机器学习区别开来;
确定是否能将实际问题公式化为RL问题,如何定义这类问题,说明哪种算法最适合解决它;
常见RL算法的代码实现;
描述用于分析评估RL算法的标准;
描述探索与开发的挑战,并对比至少两种解决这一挑战的方法。
学完本课程后,你可以用这套标准来衡量自己的学习成果。
所需基础知识
本课程不是面向零基础人士,需要掌握以下知识:
Python:本课程使用numpy、TensorFlow以及Keras
大学微积分和线性代数:理解矩阵向量的运算和符号
概率与统计学:了解概率、高斯分布、期望值、标准差等基础知识
机器学习基础:本课程将定义损失函数,并通过梯度下降算法进行优化
课程资料汇总
最后附上课程全部资源:
课程主页:
http://web.stanford.edu/class/cs234/index.html
《强化学习入门》第二版:
http://incompleteideas.net/book/the-book-2nd.html
PPT下载地址:
http://web.stanford.edu/class/cs234/schedule.html
视频地址:
https://www.youtube.com/playlist?list=PLoROMvodv4rOSOPzutgyCTapiGlY2Nd8u
— 完 —
量子位AI+系列沙龙--智慧城市
加入社群
量子位AI社群开始招募啦,量子位社群分:AI讨论群、AI+行业群、AI技术群;
欢迎对AI感兴趣的同学,在量子位公众号(QbitAI)对话界面回复关键字“微信群”,获取入群方式。(技术群与AI+行业群需经过审核,审核较严,敬请谅解)
诚挚招聘
量子位正在招募编辑/记者,工作地点在北京中关村。期待有才气、有热情的同学加入我们!相关细节,请在量子位公众号(QbitAI)对话界面,回复“招聘”两个字。
量子位 QbitAI · 头条号签约作者
վ'ᴗ' ի 追踪AI技术和产品新动态
喜欢就点这里吧 !
斯坦福2019强化学习课程完结,讲义、PPT、视频已提供下载相关推荐
- 斯坦福 cs234 强化学习笔记整理活动 | ApacheCN
整体进度:https://github.com/apachecn/stanford-cs234-notes-zh/issues/1 贡献指南:https://github.com/apachecn/u ...
- 【重磅推荐: 强化学习课程】清华大学李升波老师《强化学习与控制》
深度强化学习实验室 官网:http://www.neurondance.com/ 论坛:http://deeprl.neurondance.com/ 编辑:DeepRL <强化学习与控制> ...
- UC伯克利最新深度强化学习课程上线,视频已上传到B站
乾明 发自 凹非寺 量子位 报道 | 公众号 QbitAI 又有新的AI学习资源上线了. 这次是来自UC伯克利的秋季课程:Deep Reinforcement Learning,课程代号CS 285 ...
- 伯克利2019深度学习课程—李沐及其亚马逊同事一起讲述(内附视频链接及PDF下载)
点上方蓝字计算机视觉联盟获取更多干货 在右上方 ··· 设为星标 ★,与你不见不散 伯克利2019深度学习课程是李沐老师大致按照李沐老师的开源新书<动手学深度学习>来安排的(和去年放出的同 ...
- 资源 | UC Berkeley CS 294深度强化学习课程(附视频、学习资料)
来源:机器之心 本文共4000字,建议阅读10分钟. 本文主要介绍了课程中的强化学习主题,涉及深度强化学习的基本理论与前沿挑战. CS294 深度强化学习 2017 年秋季课程的所有资源已经放出.该课 ...
- MachineLearning(6)-Daviad Silver强化学习课程脉络整理
强化学习-Daviad Silver强化学习课程脉络整理 1.lecture1 introduction 1.1 强化学习简介 1.2 强化学习类别 1.3 强化学习的主要问题 2.lecture2 ...
- 强化学习课程(David Silver)笔记(2)——MDP
本文概要 本文个人是对david silver强化学习课程第二课的总结,有任何不足之处希望大家指正! 马尔可夫决策过程(MDP)精确描述了环境,MDP假设环境是完全可观的并且环境中所有的状态都满足马尔 ...
- 强化学习驱动的低延迟视频传输
随着视频会议.视频直播的流行以及未来AR/VR业务的发展,低延迟视频传输服务被广泛使用,但视频质量(QoE)还不能满足用户要求.那么近年来新兴的AI神经网络是否能为视频传输带来智能化的优化?今天Liv ...
- 快讯:2019 OOW 文档已提供下载
在2019 Oracle OOW大会刚刚落幕之际,大会的部分PPT讲稿已经开始提供下载.我们整理了批量下载资源,你可以关注本公众号,回复:2019OOW 关键词获得. 类似的,回复历年关键词(如:20 ...
最新文章
- 【scala初学】scala symbol 符号 -3
- 深度学习还不能解决什么问题?
- linux安装trac+svn+apache+wike,windos中Trac+apache+svn的安装与配置
- Pycharm超使用快捷键
- python自动发送邮件不需要发件邮箱_python使用QQ邮箱实现自动发送邮件
- DOM中对表格的操作
- 在vb中使用Iphlpapi.dll获取网络信息(上)
- 老树发新芽—使用 mobx 加速你的 AngularJS 应用
- “保姆级教程“c语言开根号函数:sqrt()//文末附有详细c语言数学函数
- ai的预览模式切换_ai模式切换快捷键是什么,Adobe Illustrator模式切换快捷键是什么?...
- 零基础如何学习视频制作?超全干货!手把手教你好上手的视频制作技巧
- Logstash详解之——input模块
- 虚拟服务器忘记密码,Win7系统下VMware虚拟机忘记开机密码如何解决
- JAVA合并pdf,拆分pdf文档
- 微信公众号js-sdk定位 获取经纬度和详细位置
- 安卓玩机搞机技巧综合资源-----卸载内置软件 获取root权限 刷写第三方ROM【六】
- 从2.3.3到4.1.1:最全的android系统源码下载大集合
- linux(shell)查看文件时间戳
- win10右键菜单添加“用记事本打开文件”
- 计算机网络期末填空小结