晓查 发自 凹非寺 
量子位 出品 | 公众号 QbitAI

斯坦福大学AI课程资源接二连三开始更新。上周NLP课程才结束,这周强化学习(RL)课程也已全部完结。

现在,强化学习课程讲义、PPT可以在官网下载,第一部分的课程已上传至YouTube。

本课程主讲人是斯坦福大学的助理教授Emma Brunskill。她2009年从MIT博士毕业,现在是斯坦福统计机器小组成员,2012年曾入选微软研究院Fellow。

Emma教授的主要研究方向是高风险场景下的强化学习:当获取经验的成本和风险很高时,智能体如何从经验中学习并做出正确的决策。实际应用包括教育软件、医疗决策、机器人等。

课程内容

斯坦福大学今年的RL课程从1月7日开始,每周2节课,共持续10周,到今年3月13日结课。

课程内容主要有:强化学习入门、学习评估策略、函数近似、大空间中的模仿学习、策略搜索、元学习、批量强化学习等等。

Emma教授给学生制定了这些目标:

定义强化学习的关键特征,并将其与非交互式的机器学习区别开来;
确定是否能将实际问题公式化为RL问题,如何定义这类问题,说明哪种算法最适合解决它;
常见RL算法的代码实现;
描述用于分析评估RL算法的标准;
描述探索与开发的挑战,并对比至少两种解决这一挑战的方法。

学完本课程后,你可以用这套标准来衡量自己的学习成果。

所需基础知识

本课程不是面向零基础人士,需要掌握以下知识:

Python:本课程使用numpy、TensorFlow以及Keras
大学微积分和线性代数:理解矩阵向量的运算和符号
概率与统计学:了解概率、高斯分布、期望值、标准差等基础知识
机器学习基础:本课程将定义损失函数,并通过梯度下降算法进行优化

课程资料汇总

最后附上课程全部资源:

课程主页:
http://web.stanford.edu/class/cs234/index.html

《强化学习入门》第二版:
http://incompleteideas.net/book/the-book-2nd.html

PPT下载地址:
http://web.stanford.edu/class/cs234/schedule.html

视频地址:
https://www.youtube.com/playlist?list=PLoROMvodv4rOSOPzutgyCTapiGlY2Nd8u

量子位AI+系列沙龙--智慧城市

加入社群

量子位AI社群开始招募啦,量子位社群分:AI讨论群、AI+行业群、AI技术群;

欢迎对AI感兴趣的同学,在量子位公众号(QbitAI)对话界面回复关键字“微信群”,获取入群方式。(技术群与AI+行业群需经过审核,审核较严,敬请谅解)

诚挚招聘

量子位正在招募编辑/记者,工作地点在北京中关村。期待有才气、有热情的同学加入我们!相关细节,请在量子位公众号(QbitAI)对话界面,回复“招聘”两个字。

量子位 QbitAI · 头条号签约作者

վ'ᴗ' ի 追踪AI技术和产品新动态

喜欢就点这里吧 !

斯坦福2019强化学习课程完结,讲义、PPT、视频已提供下载相关推荐

  1. 斯坦福 cs234 强化学习笔记整理活动 | ApacheCN

    整体进度:https://github.com/apachecn/stanford-cs234-notes-zh/issues/1 贡献指南:https://github.com/apachecn/u ...

  2. 【重磅推荐: 强化学习课程】清华大学李升波老师《强化学习与控制》

    深度强化学习实验室 官网:http://www.neurondance.com/ 论坛:http://deeprl.neurondance.com/ 编辑:DeepRL <强化学习与控制> ...

  3. UC伯克利最新深度强化学习课程上线,视频已上传到B站

    乾明 发自 凹非寺  量子位 报道 | 公众号 QbitAI 又有新的AI学习资源上线了. 这次是来自UC伯克利的秋季课程:Deep Reinforcement Learning,课程代号CS 285 ...

  4. 伯克利2019深度学习课程—李沐及其亚马逊同事一起讲述(内附视频链接及PDF下载)

    点上方蓝字计算机视觉联盟获取更多干货 在右上方 ··· 设为星标 ★,与你不见不散 伯克利2019深度学习课程是李沐老师大致按照李沐老师的开源新书<动手学深度学习>来安排的(和去年放出的同 ...

  5. 资源 | UC Berkeley CS 294深度强化学习课程(附视频、学习资料)

    来源:机器之心 本文共4000字,建议阅读10分钟. 本文主要介绍了课程中的强化学习主题,涉及深度强化学习的基本理论与前沿挑战. CS294 深度强化学习 2017 年秋季课程的所有资源已经放出.该课 ...

  6. MachineLearning(6)-Daviad Silver强化学习课程脉络整理

    强化学习-Daviad Silver强化学习课程脉络整理 1.lecture1 introduction 1.1 强化学习简介 1.2 强化学习类别 1.3 强化学习的主要问题 2.lecture2 ...

  7. 强化学习课程(David Silver)笔记(2)——MDP

    本文概要 本文个人是对david silver强化学习课程第二课的总结,有任何不足之处希望大家指正! 马尔可夫决策过程(MDP)精确描述了环境,MDP假设环境是完全可观的并且环境中所有的状态都满足马尔 ...

  8. 强化学习驱动的低延迟视频传输

    随着视频会议.视频直播的流行以及未来AR/VR业务的发展,低延迟视频传输服务被广泛使用,但视频质量(QoE)还不能满足用户要求.那么近年来新兴的AI神经网络是否能为视频传输带来智能化的优化?今天Liv ...

  9. 快讯:2019 OOW 文档已提供下载

    在2019 Oracle OOW大会刚刚落幕之际,大会的部分PPT讲稿已经开始提供下载.我们整理了批量下载资源,你可以关注本公众号,回复:2019OOW 关键词获得. 类似的,回复历年关键词(如:20 ...

最新文章

  1. 【scala初学】scala symbol 符号 -3
  2. 深度学习还不能解决什么问题?
  3. linux安装trac+svn+apache+wike,windos中Trac+apache+svn的安装与配置
  4. Pycharm超使用快捷键
  5. python自动发送邮件不需要发件邮箱_python使用QQ邮箱实现自动发送邮件
  6. DOM中对表格的操作
  7. 在vb中使用Iphlpapi.dll获取网络信息(上)
  8. 老树发新芽—使用 mobx 加速你的 AngularJS 应用
  9. “保姆级教程“c语言开根号函数:sqrt()//文末附有详细c语言数学函数
  10. ai的预览模式切换_ai模式切换快捷键是什么,Adobe Illustrator模式切换快捷键是什么?...
  11. 零基础如何学习视频制作?超全干货!手把手教你好上手的视频制作技巧
  12. Logstash详解之——input模块
  13. 虚拟服务器忘记密码,Win7系统下VMware虚拟机忘记开机密码如何解决
  14. JAVA合并pdf,拆分pdf文档
  15. 微信公众号js-sdk定位 获取经纬度和详细位置
  16. 安卓玩机搞机技巧综合资源-----卸载内置软件 获取root权限 刷写第三方ROM【六】
  17. 从2.3.3到4.1.1:最全的android系统源码下载大集合
  18. linux(shell)查看文件时间戳
  19. win10右键菜单添加“用记事本打开文件”
  20. 计算机网络期末填空小结

热门文章

  1. 为什么所有人都对 HTML、CSS 失望了?
  2. 拒绝空谈 AI 设想!手把手教你构建实时、高可用的 AI 调度平台
  3. 996 都升不了职的程序员该如何拯救?
  4. matlab exe mingw,matlab笔记:安装MinGW编译器
  5. 光栅衍射主极大个数_基于达曼光栅的双目视觉系统
  6. java jnlp 签名_JAVA JNLP组件数字签名制作步骤
  7. python大文件排序_Python如何实现大文件排序?Python大文件排序的实现方法
  8. Hooks解决了什么问题?
  9. JavaScript内存那点事
  10. jQuery的getter和setter