强化学习主要是(Reinforcement learning)是一个独立的机器学习研究领域。

1.监督学习:

监督学习主要希望研究映射关系:

:它是待定系数。

机器学习范畴:知道x,y,不知道。反向推导出“

训练过程:足够的x,及对应的y,作为参数,逐步求出待定系数 的过程

当通过这样一个过程学习到 应该为什么值的时候,如果再有x,通过函数 

可以计算出y的值。

这是监督学习中一个典型问题---线性回归。

2.非监督学习:

入门算法k-means.

在一个空间中,有很多的空间点向量(Vector),这些点在空间中的分布很可能是不均匀的。

是否能够找出各自分布的区域的中心点位置?通过k-means算法可以做到。

例子:用户的年龄、收入、贷款金额数据,通过聚类找出人群的分布,研究相同分布下的这些点的共性,针对不同的人群尝试设计相应的产品和业务,以分别满足他们的需要。

另外,可以研究离群点,它们为什么特殊?数据收集系统本身的问题还是这个点本来就是个“异类”。如诈骗事件的特征点描述。

模型体系,方法论

迁移学习(Transfer Learning)、生成对抗网络(Generative Adversarial Networks,GAN)、强化学习

处理数据,建模,训练,调优

1.1 题设

我们希望机器人足够“智能”:推理能力,判断能力,分析能力。基于这些能力自动进化,完成任务。

未来机器人电影:《终结者》《机器人总动员》

人形机器人的研究范畴:材料学,工程力学,大规模集成电路,高精度传感器工程学

算法,机器学习只占了其中一小部分。

基于海量样本训练的阿尔法围棋(Alphago)惊叹表现

问题:人脸识别(face Recognition),物体识别(Object Detective)等可以通过强化学习实现吗?

1.1.1 多智能才叫智能

强化学习:优美自然的推理过程

深度神经网络,是仿生学对人体神经结构顶礼膜拜在计算机领域的完美落地

遗传算法:大大减少计算量,对于NP问题等复杂问题有着极高的提升效率的作用

自举:自己抓着自己的头发把自己举起来

神经网络之间的信号传递、遗传因子,“孟山都”

1.1.2 人工智能的定义

到底什么是人工智能?

机器自己分析、思考、进化?

有多少“人工”,就有多少“智能”

艾伦 麦席森 图灵 图灵测试(The Turing test):将一个测试者(一个人)与被测试者(一台机器)隔开,由测试者通过一些装置(键盘等)向被测试者随意提问。进行多次测试后,如果有超过30%的测试者不能确定被测试者是人还是机器,那么这台机器就通过了测试,并被认为具有人类智能。

人工智能:高质量自动化过程,只要它能在人类关心的范畴高质量地完成作业就够了。

在一定的应用范畴提高自动化程度、降低错误率、或者能在错误率与人类相当的情况下极大地提高处理效率,给出的结果和我们期望由一个人来完成工作的结果很接近,就可以了。

1.2 强化学习的研究对象

《白话强化学习与PyTorch》第1章 强化学习是什么----读书笔记相关推荐

  1. 视频教程-深度学习与PyTorch入门实战教程-深度学习

    深度学习与PyTorch入门实战教程 新加坡国立大学研究员 龙良曲 ¥399.00 立即订阅 扫码下载「CSDN程序员学院APP」,1000+技术好课免费看 APP订阅课程,领取优惠,最少立减5元 ↓ ...

  2. Oracle 19c VLDB and Partitioning Guide 第8章:Using Parallel Execution 读书笔记

    本文为Oracle 19c VLDB and Partitioning Guide第8章Using Parallel Execution的读书笔记. 并行执行是通过使用多个进程将多个 CPU 和 I/ ...

  3. 《电路分析基础》第7章 正弦稳态电路 读书笔记

    <电路分析基础>第7章 正弦稳态电路 读书笔记 想念生物笔记...

  4. 《电路分析基础》第1章 电路模型和电路元件 读书笔记

    <电路分析基础>第1章 电路模型和电路元件 读书笔记 电路和电路模型 电路变量 基尔霍夫定律 电阻元件 电压源 电流源 受控源 电阻的等效变换 输入电阻 电源的等效变换 电路和电路模型 电 ...

  5. 《深度学习入门:基于Python的理论与实现》读书笔记:第8章 深度学习

    目录 8.1 加深网络 8.1.1 向更深的网络出发 8.1.2 进一步提高识别精度 8.1.3 加深层的动机 8.2 深度学习的小历史 8.2.1 ImageNet ​8.2.2 VGG 8.2.3 ...

  6. 《深度学习实战》第1章 深度学习的发展介绍

    参考书籍<深度学习实战>杨云.杜飞著 第1章 深度学习的发展介绍 介绍 python是一种非常简单易学的解释性语言.由于强大的开源库支持(numpy,scipy,matplotlib),其 ...

  7. 如何高效学习,如何快速掌握某种技能-刻意练习20200309读书笔记

    [美]安德斯-艾利克森  罗伯特-普尔  著:王正林 译:机械工业出版社  2016年出版: 引言  天才存在吗 莫扎特的完美音高 这显然意味着完美音高根本谈不上是只有幸运的少数人才拥有的天赋,而是一 ...

  8. 每个人的商学院--管理基础(第三章:管理工具)--读书笔记

    第三章:管理工具 面向业绩:梦想归梦想,绩效归绩效 读书笔记: 管理工作并非总能收获大团圆的结局,还要时常做出真正艰难的决定. 管理只对绩效负责. 绩效就是达成公司的经营目标. 公司里的两层关系:第一 ...

  9. 《移山之道》第十一章:两人合作 读书笔记 PB16110698 第六周(~4.15)

     本周在考虑阅读材料时,我翻阅了<移山之道>,正好看到这一章:两人合作,心想:正好,我们正值结对作业的紧要关头,书中两人合作的宝贵经验和教诲应当对我们有很大帮助.于是,我开始一边在ddl苦 ...

  10. 《推荐系统实践》 第四章 利用用户标签数据 读书笔记

    推荐系统的目的是联系用户的兴趣和物品,这种联系需要依赖不同的媒介.GroupLens在一篇文章(文章名是"Tagsplanations : Explaining Recommendation ...

最新文章

  1. 影响计算机算法世界的十位大师(上)
  2. 解决mysql 1040错误Too many connections的方法
  3. python 按月份分组_django ORM queryset按月、周、TruncMonth分组
  4. BeetleX.FastHttpApi之Vuejs扩展
  5. 吴恩达DeepLearningCourse5-序列模型
  6. 【TypeScript系列教程07】变量声明
  7. MVC三层架构在各框架中的特征
  8. 金蝶K3对接数据库相应语句大全
  9. FreePiano下载与使用
  10. CNCF:Kubernetes 已“跨越鸿沟”,逆袭成为主流
  11. 强化学习笔记: Model-based Approaches(1)
  12. 【USACO】山峰暸望
  13. python 将输出打印到文件
  14. 改善编程体验: IdeaVimExtension介绍 1
  15. 素描滤镜_素描fu自定义键盘快捷键
  16. 标梵互动教你巧妙使用CSS变量使您的CSS更有吸引力
  17. 数学之美11--拼音输入法的数学原理
  18. 数字化时代,RPA将终结BPO?
  19. 无需工具 爱奇艺视频 qsv格式轻松简单转换成mp4格式的方法
  20. Web应用程序停止时无法注销它。 为防止内存泄漏,JDBC驱动程序已被强制取消注册。

热门文章

  1. php tcp获取数据_php建立tcp服务请求数据双向通信问题
  2. 单片机io取反c语言,【51单片机】普通I/O口模拟SPI口C语言程序
  3. 世界地图可以无限放大_做外贸有哪些软件可以推荐?
  4. 德国人制作的 Windows 2000/XP 优化脚本2.2_build9 (2008-05-31)
  5. 01-微信小程序商城 商城框架的制作(微信小程序商城开发、小程序毕业设计、小程序源代码)(黄菊华-微信小程序开发教程)
  6. 花钱购买C语言教程,秘籍:小白从零开始玩转C语言教程,足足300集
  7. VBA基本语法及基本使用
  8. cmd命令打开文本文档_Windows常用cmd命令总结
  9. VB程序设计算机,VB编程:编写一个过程,用来计算并输出 S=1+1/2+1/3+……+1/100 的值。...
  10. 编程与python的区别_python与其他编程语言区别全在这