在前文我们介绍统计学简介(AI从零开始之统计学简介)的时候说,我们是为了那个虚无缥缈的f而奋斗的,我们知道做任何事情其实都是有一定目的的,比如说我们工作是为了赚钱,赚钱是为了买房,买房是为了娶老婆,娶老婆是为了生孩子,生孩子是为了传宗接代(开个玩笑)。那么我们来评估f是为了什么呢?其实,说白了业界认为其实就主要有两个目的:“预测”( prediction)和“推论”(inference)

预测

很多情况,像我们之前提到的房价预测。它就是通过一系列我们已经看到的X和Y的结果,来进行预测心得输入的结果。我们之前提到Y = f(X) + Ɛ, 而因为Ɛ的平均值是0,所以我们可以用下面公式来进行预测:

其中f^就是f的预测,而Y^则是我们想要的结果Y的预测值。一般来说,这种情况,我们不care 究竟是什么,我们要的是结果,所以 对我们来说就是一个黑盒。

我们通常认为Y^ 的准确性有两部分来决定,一部分就是f^的准确性,这部分我们称之为可减少(reducible)。他是由于 f^这个的不准确性导致的,我们理论上可以通过技术的改进,不断地缩小这个误差,使得f^=f,从而 。那么这种情况下的y^ 就是准确的吗,其实并不然,我们在之前的文章中提到,其实真实的Y值还和Ɛ相关,而Ɛ则是和X无关的一个误差,这个误差是没有办法规避的,我们称之为irreducible。

到了这个时候,我想你可能就要问了,这个Ɛ究竟是怎么来的啊,为什么我们不能避免啊,其实一般意义上来说,Ɛ可能是由一些我们没有测量的值引入的。比如说我们预测房价,我们有了和房价相关的各种因素,比如面积,学区,交通等等,但是我们没有去收集装修信息,那么这个装修信息就成了我们这个Ɛ的一个来源;除了这个,还有一种是没法收集的信息引入的误差,比如房子墙角的蜘蛛网,让来看房的人感觉不舒服,或者买房人的讨价还价的能力,这些都可能引起最终房价的波动。而这些就是一些我们没法通过技术来规避的误差。

推论

这种情况下的case,一般来说我们会关系Y和各个X之间的关系,而不是去预测一个新的输入会有什么样的输出。比如说我们提到到的工资和学历以及经验之间的例子,假如我们更关心的是不同的工资究竟受学历的影响情况如何,而不是说来预测一个新的学历的人能拿到多少工资。

在这种情况下, f^就不能是一个黑盒了,我们需要通过 f^来分析各种X对Y^ 的影响程度。

一般来说,推论可以回答这些问题:

1.      哪些用来预测的X是和Y相关联的,这个在有大量X而真正重要的X比较少的情况下尤其有效。

2.      Y和各个X之间的关系。就是说我们修改每一个X对Y的最终是一个正向的影响还是一个负向的影响。这样我们就可以决定如何修改这些X了。

3.      Y和各个X之间的关系可以用简单的线性关系来描述还是必须要用一个复杂的公式来描述。

这就是本文想要解释的我们为f而奋斗两个重要目的,预测和推论。

更多原创,敬请关注微信公众号,每日更新业界最新资讯:

欢迎访问个人小站: https://donggeitnote.com

AI从零开始之我们为什么要为了那个虚无缥缈的f而奋斗相关推荐

  1. 用AI从零开始创建一个宫崎骏的世界

    前言 学习人工智能有段日子了,一直感觉问题定义难,模型设计难,算力不足难,部署落地更难.期间掉坑无数,出坑不易.结合这段时间的心路历程,完整的记录一个AI应用,从实际问题出发到模型选型.数据收集.数据 ...

  2. AI 利用BP算法及Sigmoid函数,研究函数f(x)=2sinx-0.7的逼近问题-实验报告

    1. 问题描述及实验要求 (1)写出包含单隐层的正向和反向推倒过程 (2)画出网络结构图 (3)完成算法代码(要求体现推倒过程,也可采用tensorflow完成) (4)画出误差随迭代次数变化曲线.测 ...

  3. 对战全程视频!顶级高手苦练DOTA半辈子,就这样被AI击败

    本文来自AI新媒体量子位(QbitAI) 一直只听说你们AI圈要打星际,怎么忽然打起DOTA了! 今天一早,AI似乎震惊了不少同学:在堪称"DOTA圈世界杯"的TI7邀请赛上,顶级 ...

  4. 生成式AI发现潜在抗癌药物;王慧文与“一流科技”达成并购意向;阿里巴巴公布六大业务集团CEO丨每日大事件...

    ‍ ‍数据智能产业创新服务媒体 --聚焦数智 · 改变商业 企业动态 阿里巴巴公布六大业务集团CEO:张勇兼任阿里云智能集团CEO 3月28日,阿里巴巴集团董事会主席兼首席执行官张勇发布全员信,宣布启 ...

  5. 如何通向“广义人工智能”?LSTM 提出者之一Sepp Hochreiter:将符号 AI 与神经 AI 相结合...

    来源:AI科技评论 作者:Sepp Hochreiter 解读:Antonio 编辑:陈彩娴 人类包含意识.认知.决策等等在内的智慧能力,似乎从人类有记录的那一刻起,就吸引着无数哲学家的思索.与之类似 ...

  6. AI批量导出SVG格式图片

    软件版本:Illustratorlcc2015 解决直接用ai批量导出时,勾选画板得到空白svg图像问题. 解决方法: 先用画板导出为EPS格式一个一个的大小,每一个可以使用画板, 然后在AI打开所有 ...

  7. 5G+边缘 AI在工业质检中的应用研究

      摘要:  5G+边缘 AI 的无线大带宽传输.智能化识别.低时延本地处理.安全稳定等特点,在一定程度上解决了工业质检检测难度高.人力成本居高不下.检测效率低下等问题.主要介绍 2 种常见的基于 5 ...

  8. OPPO R11s今日发布:AI与全面屏的碰撞

    11月2日15:00, OPPO R11s北京雁栖湖国际会展中心,R11s发布会也是吸引了众人的关注. 器宇轩昂的现场,古代与现代的结合,充分的体现了发布会的强大魅力. 强大的魅力也是展现了OPPO ...

  9. 2020最佳双人博弈对抗方法 | 基于强化学习对手建模的滚动时域演化算法「AI核心算法」...

    关注:耕智能,深耕AI脱水干货 作者:唐振韬  报道:深度强化学习 CASIA 转载请联系作者 前言 格斗游戏是一项极具挑战的双人实时对抗人工智能博弈任务,常具有组合动作空间规模大.角色属性风格多样. ...

  10. caffe-gpu ubuntu 安装_ubuntu16.04 cuda10.0 配置caffe gpu环境

    caffe gpu环境的配置就是一部赤裸裸的血泪史,每次都能遇到很多问题~ 环境依赖 ubuntu 16.04cuda 10.0python 3.5opencv 3.4.10sudo apt-get ...

最新文章

  1. 第四课:算法效率的度量和存储空间需求
  2. 推荐一个 React 技术揭秘的项目,自顶向下的 React 源码分析
  3. HTML编码问题导致的乱码
  4. 微信小程序----全局变量
  5. python 虚拟环境原理_Python 虚拟环境
  6. 图像的灰度级和动态范围(转)
  7. NLP研究者必备的语言学书籍!
  8. 云+X案例展 | 传播类:九州云 SD-WAN 携手上海电信,助力政企客户网络重构 换新颜
  9. 手绘导图版:深入解析机器学习在风控场景中的8大应用
  10. 艾伟也谈项目管理,开始一个项目时最重要的是什么?
  11. docker装LibreELEC_如何在LibreELEC上安装Entware?
  12. 怎样彻底卸载电脑上的软件
  13. 【实习记录】pytorch学习(持续更新)
  14. maven日记(一):Maven使用入门
  15. php界面入门,web前端入门:一小时学会写页面 - 空酷狗
  16. 血浆游离RNA提取试剂盒(附文献参考)
  17. 2022-2028年全球与中国救生艇行业市场前瞻与投资战略规划分析
  18. Flex 布局教程:语法篇
  19. cup过高是什么意思_CPU占用过高怎么办? 每日一答
  20. Windows7启动用AHCI模式,进系统时蓝屏?

热门文章

  1. (详细)Windows10系统自动修复方法
  2. 厦门大学计算机专业录取分数线2019,2019厦门大学各省录取分数线是多少
  3. 数据建模 - 概念模型,逻辑模型,物理模型 的区别以及建模方式
  4. Openssl 命令之cer证书转成pem. 利用ptf私钥文件生成公钥
  5. 读了本书《3000美金,我周游了世界》
  6. LINK : fatal error LNK1561和LINK : fatal error LNK1168:解决方法
  7. 手机投屏不是全屏怎么办_一招搞定手机投屏不是全屏问题,手机投屏自适应全屏...
  8. lsb_slam Tracking线程 SE3Tracking 欧式变换矩阵跟踪参考帧 加权高斯牛顿优化算法WLM 最小二乘优化 归一化方差的光度误差函数 偏导数雅克比矩阵J 线性方程组LDLT求解
  9. HTML链接会议申请,会议流程.html
  10. Linux系统编程学习笔记