学习深度学习过程中,如果有一本好的书跟读可以最快的入门。

最开始看了李沐老师的动手学深度学习,书中有理论知识,有代码,可以很好的入门。代码使用的mxnet框架,可能在学校中使用的较少

今天看到一本书,龙龙老师的TensorFlow深度学习,电子版免费开放https://github.com/dragen1860/Deep-Learning-with-TensorFlow-book。

书中第一章介绍机器学习

机器学习可以分为有监督学习(Supervised Learning)、无监督学习(Unsupervised Learning)、强化学习(Reinforcement Learning)

有监督学习:

有监督学习的数据集包含了样本x与样本的标签y,算法模型需要学习到映射关系:x——>y,其中代表模型函数,为模型参数。在训练时,通过计算模型的预测值与真实标签y之间的误差,来优化网络参数,使得网络的下一次预测能够预测更精准。常见的有监督学习有    线性回归、逻辑回归、支持向量机、随机森林等。

无监督学习:

收集带标签的数据往往会代价较为昂贵,对于只有样本x的数据集,算法需要自行发现数据的模态,这种方式叫做无监督学习。

无监督学习中有一类算法将自身作为监督信号,即模型需要学习的映射为:x——>x,称为自监督学习(self-supervised Learning)。

通过计算模型的预测值与x之间的误差来优化网络参数

常见的无监督学习算法有   自编吗器、生成对抗网络等。

强化学习:

增强学习。通过与环境进行交互来学习解决问题的策略 的一类算法。

与有监督、无监督学习不同,强化学习问题并没有明确“正确的”动作监督信号,算法需要与环境进行交互,获取环境反馈的滞后的奖励信号,因此并不能通过计算动作与“正确动作”之间的误差来优化网络。常见的强化学习算法有DQN,PPO等。

简单理解有监督学习、无监督学习、强化学习相关推荐

  1. 机器学习的五大分类,监督学习 无监督学习 半监督学习 迁移学习 增强学习

    机器学习的五大分类,监督学习 无监督学习 半监督学习 迁移学习 增强学习@监督学习 无监督学习 半监督学习 监督学习 在监督学习中,给定一组数据,我们知道正确的输出结果应该是什么样子,并且知道在输入和 ...

  2. AI:人工智能领域算法思维导图集合之有监督学习/无监督学习/强化学习类型的具体算法简介(预测函数/优化目标/求解算法)、分类/回归/聚类/降维算法模型选择思路、11类机器学习算法详细分类之详细攻略

    AI:人工智能领域算法思维导图集合之有监督学习/无监督学习/强化学习类型的具体算法简介(预测函数/优化目标/求解算法).分类/回归/聚类/降维算法模型选择思路.11类机器学习算法详细分类(决策树/贝叶 ...

  3. 监督学习无监督学习_无监督学习简介

    监督学习无监督学习 To begin with, we should know that machine primarily consists of four major domain. 首先,我们应 ...

  4. 基于深度强化学习的机器人运动控制研究进展 | 无模型强化学习 | 元学习

    1.基于深度强化学习的机器人运动控制研究进展 1.1 深度强化学习 1.1.1 强化学习简介: 强化学习(Reinforcement Learning, RL)利用试错机制与环境进行交互,旨在通过最大 ...

  5. Supervised learning/ Unsupervised learning监督学习/无监督学习

    [机器学习]两种方法--监督学习和无监督学习(通俗理解) [机器学习] : 监督学习 (框架) 有监督学习与无监督学习的几大区别 目录 Supervised learning 监督学习 Unsuper ...

  6. 第一周-机器学习监督学习-无监督学习

    这仅是本人在cousera上学习机器学习的笔记,不能保证其正确性,谨慎参考 关系图: 监督学习(Supervised Learning): 回归预测(Regression:predict real-v ...

  7. 无梯度强化学习:使用Numpy进行神经进化

    作者|Jacob Gursky 编译|VK 来源|Towards Data Science 介绍 如果我告诉你训练神经网络不需要计算梯度,只需要前项传播你会怎么样?这就是神经进化的魔力!同时,我要展示 ...

  8. 吴恩达机器学习(二)监督学习/无监督学习

    文章目录 1.监督学习 2.无监督学习 1.监督学习 定义: 根据已有的数据集,知道输入和输出结果之间的关系.根据这种已知的关系,训练得到一个最优的模型.也就是说,在监督学习中训练数据既有特征(fea ...

  9. 论文笔记-连续HVAC控制的无模型强化学习算法的实验评估

    本文在一个模拟的数据中心中对四种actor-critic算法进行了实验评估.性能评估基于它们在提高能效的同时保持热稳定性的能力,以及它们对天气动态的适应性.与在EnergyPlus中实施的基于模型的控 ...

  10. 【零基础学机器学习 3】机器学习类型简介:监督学习 - 无监督学习 - 强化学习

最新文章

  1. 全球及中国家庭用空气净化器行业供需分析及发展营利模式预测报告2022-2027年
  2. python输入多行字符串_python中怎么输入多行字符串
  3. 戴尔新版bios设置中文_U盘快捷启动键查询 | BIOS按键查询
  4. TransmittableThreadLocal 解决 线程池线程复用 无法复制 InheritableThreadLocal 的问题.
  5. Vue 视频播放插件vue-video-player
  6. PCM信号是什么信号?
  7. C# 装箱和拆箱、理论概念(非原创)
  8. js图片前端压缩多图上传(旋转其实已经好了只是手机端有问题要先压缩再旋转)...
  9. MySqlDataReader在Using中使用
  10. c语言交通灯程序闪烁,用C语言编写的交通灯程序
  11. python3 selenium ie 拒绝连接报错_python Selenium权限错误:[WinError 5]访问被拒绝
  12. MicroSIP编译完全手册
  13. 我的第一个hbulider项目
  14. 三分钟细数 el-form 表单校验的坑点,前车之鉴,可助你避坑
  15. 软件中的质量属性(二)
  16. python读取页眉页脚,python批量替换页眉页脚
  17. 计算机cpu intel,Intel的CPU后面带F是什么意思?
  18. MATLAB图像融合分割系统
  19. Python处理PDF神器PyMuPDF的安装与使用
  20. 批量提取 data/app目录中的apk文件

热门文章

  1. 【CCF会议期刊推荐】中国计算机协会(CCF)推荐国际学术期刊/会议(软件工程/系统软件/程序设计语言)
  2. 【期刊会议】机器学习深度学习 + 计算机视觉(To be continued..)
  3. 微信公众号H5合成图片长按下载
  4. php 监听 扫描枪,Android监听扫描枪内容(一)
  5. 人脸识别权威评测和人脸识别技术现状
  6. 微信小程序小说云开发免费源码
  7. 安卓Android问卷调查系统app
  8. STM32中使用MMA7660重力加速度传感器
  9. 5wpa_supplicant程序 --详解
  10. 浅谈在线IDE的搭建,配置,体验