http://www.woshipm.com/ai/2500367.html

本文笔者将通过对统计学和AI的关系进行分析,追溯他们的发展史,去探究:如何将对统计学如何应用到人工智能领域?

AI 不过是统计学

Thomas J. Sargent :人工智能只是统计学的延伸

2011年诺贝尔经济学奖取得者Thomas J. Sargent在题为“共享全球智慧 引领将来科技”的世界科技创新论坛上表示:

计算机是非常擅长计算,它们可以非常快速地完成计算人算不了的东西,但最终必须由人来组织和分析这些计算。你可以看一些非常成功的人工智能应用,它不仅是机器在「思考」,也是科学家在思考。像 AlphaGo 的算法看上去是第一次出现,但其实有很多非常聪明的数学,并且是由人设置教学内容。人工智能是由机器和人分饰两角的,非常有趣。

任正非:人工智能就是统计学

华为创始人兼CEO任正非在接受央视《面对面》采访,当谈到人工智能是,任正非表示:

中国没有人工智能这门课,计算机与统计学,审计学与审计学,你说我们要进入大数据时代,大数据时代做啥?统计。说明我们国家在数学上重视不够,第二个在数学中的统计学重视不够。

金榕:统计学是人工智能若干重要基础之一,但远不是全部

阿里巴巴达摩院机器智能技术实验室主任金榕:

除了统计,AI中的“学习”“推理”和“决策”中还使用了代数、逻辑、最优化等许多其他学科知识与方法。此外,有了算法后如何有效实现也非常重要。所以,单纯说AI就是统计学,或者说“所有的AI都是利用统计学来解决问题的”都是片面和不准确的。

关于AI与统计学的关系,尽管众说纷纭,各位大佬持有不同意见,但是,我们仍然不难发现统计学在AI发展中占有非常重要的位置。

统计学VS人工智能发展史

为了分析统计学和AI的关系,我们同时追溯他们的发展史,找出其中的交叉部分。

1. 统计学发展史

人类的统计实践是随着计数活动而产生的,统计发展史可以追溯到距今足有五千多年的原始社会,而使统计学开始成为一门系统的学科却是距今三百余年的事情。

从统计学三个大的发展阶段可以看出,统计学经历了实践→理论→检验三个时期,当前统计学主要是通过对数据的描述与分析来进行对未来的推断,这与AI的定义十分相似。

2. AI发展史

AI发展史可以追溯到计算机诞生时代。

在经历过二十年黄金时代的发展后,人们开始意识到计算类的功能可以被机器很好的完成。但是,对于感知类的功能却很难达到模拟人类的要求。人们对人工智能的理解也从幻想中的智能转变到重视人工技术。

Thomas J. Sargent :人工智能是由机器和人分饰两角的,非常有趣。

现在人们对于人工智能的期待,不再像科幻电影里那样不切实际。技术人员意识到当下可以实现的AI技术是基于人的“思考”,让机器来实施,AI应该着眼于解放生产力而不是“完全替换人类”。

3. 统计学和AI的交叉点

1988年,美国科学家朱迪亚·皮尔将概率统计方法引入人工智能的推理过程中。

后来,IBM的沃森研究中心把概率统计方法引入到Candide项目——一个基于200多万条语句实现了英语和法语之间的自动翻译。

1992年,华人李开复使用统计学的方法设计开发了Siri最早的原型。从将统计学引入AI研究后,直至近期大家所熟知的阿尔法go,AI的侧重之一就是机器学习。基于由人类产生的大量数据,使用人类思维去分析标记,然后引入机器进行学习,最终让机器掌握规则和规律进行工作。

我们不难发现:统计学和AI有了一个共同的研究对象——数据。

统计学概念在AI中的应用

统计学作为交叉学科之一推动着人工智能的发展,在发展中逐渐被应用于各行各业。不论以后从事AI产品经理,还是AI工程师,只有具备良好的统计学基础才能对数据分析具有准确、深入的理解。

1. 应用于调查数据

以机器学习为例:其核心是“使用算法解析数据,从中学习,然后对世界上的某件事情做出决定或预测”。

在学习之前就要进行数据分析,而机器学习需要庞大的数据集作为支撑才能保证其学习效果。

对于婴儿来说,即使只有三岁,也观看过数亿张图像,拥有庞大的数据库。要想让AI“靠谱”,就要有靠谱的数据。统计学的数据获取方法与处理方法是机器学习建立数据集必需要使用的。

图片来自:https://www.jianshu.com/p/0fed5efab3e5

统计学上的数据来源:

统计学常见数据的处理:

2. 应用于建造模型

面对没有标准定义的数据:

比如:电商平台希望把数据中会恶意退货的那些人给找出来,但数据并未指明哪些人恶意退货。

对这个具体数据,没有教科书或文献给出任何的方法。这就要有独特的处理方法,你必须考虑基于什么样的恶意退货机理和背景来建立模型,不能单一的就把有过几次退货操作的用户找出来,你就要了解用户退货方面的思维方式。

对于人类来讲,这种推断与判断的行为并没有复杂的数学运算。但对于机器来说,这一切都要基于数学运算。有效的运算模型是AI推断的基础。

面对没有模型的统计需求:

比如:运营团队希望可以预测一个新营销活动可带来的流量有多少,这并不能简单靠一些公式、几个模型解决。

现有的模型一般比较固定,例子也简单,不符合复杂的实际数据。经典统计上确定模型的优劣方法严重依赖于对数据的无法证明的众多数学假定。那么,如果想在众多统计模型中要挑一个真正满足实际需求的,就需要把数据拿过来做交叉验证。交叉验证,就是用一部分数据来建立一个模型,然后用另外一块数据来验证这个模型。交叉验证是判断AI是否能做出有效预测的重要手段。

统计学是AI发展的基础之一

通过以上对于统计学在AI领域应用的简短分析,我们不难看出统计学的确是AI不可缺少的一部分,但是仅有统计学并不能实现真正的AI。

Thomas J. Sargent与任正非对于统计学重要性的肯定是正确的,金榕对于多技术支持的观点也是正确的。统计学作为传统的经典学科,支撑起了AI发展的基础。但AI不应被定性为一门全新的技术,而应是已有技术的延伸与发展。没有哪项新技术是凭空诞生的,未来将传统学科应用于新领域是高等教育的一个转折点。

本篇文章仅是作者在学习统计学时的做的一些思考,希望能抛砖引玉。随着大数据时代的来临,未来将有更多PM投身于数据分析,设计出优秀的数据分析、预测工具。

AI时代的中层支柱:统计学相关推荐

  1. AI 时代人文写作的机遇与挑战:“诗人”微软小冰启示录

    AI 时代的到来确实为当下的人文写作带来了新的机遇和挑战,"小冰"出版诗集就是一个很好的个案,能为我们提供多元而丰富的启示. 2017年5月19日,在举世瞩目的柯洁与 AlphaG ...

  2. 光环国际,做AI时代的赋能者

    2017年12月2日,由光环国际举办的"FMI2017人工智能前沿应用与人才发展论坛"在北京中关村国际会议中心成功召开.光环国际创始人兼CEO张泽晖先生在大会现场做了重要讲话,对现 ...

  3. AI时代来了,它会不会取代“程序猿”

    程序员们,AI来了,机会来了,危机也来了 1.人工智能真的来了 纵观古今,很少有计算机技术能有较长的发展寿命,大部分昙花一现,比如:昔日的DOS.windows3.2.foxpro.delphi.80 ...

  4. 招商银行周天虹:AI时代的分布式数据库是什么样的?

    在AI.大数据技术的推动下,银行的传统经营模式正在发生根本性的变化,数据驱动的轻型银行模式随之诞生.而在向数据驱动方向奔驰的路上,如何高效处理海量数据成为一个重要的课题.作为我国银行业数字化转型的先锋 ...

  5. 【深度首发】eyemore能否成为AI时代的“索尼”?丨Xtecher 封面

    eyemore作为一家从事前端成像引擎的技术公司,商业模式就是通过自主研发的成像引擎,为各个应用场景下的机器视觉公司赋能,终极目标是围绕自己的成像引擎构建一个AI成像生态系统,并成为领军者. 作者|张 ...

  6. 年薪200W+的 “ChatGPT提示工程师”,是AI时代下逆袭的好职业吗?

    作者| Mr.K   编辑| Emma 来源| 技术领导力(ID:jishulingdaoli) 使用同样的画笔,有人画出百鸟朝凤图,有人画出小鸡吃米图:同样的道理,用户使用同样的ChatGPT,问看 ...

  7. AI时代的三类人:探索掌握AIGC,引领未来的人才之路

           (本文阅读时间:6 分钟) 1 AI时代:ChatGPT引领AIGC技术革命 对于那些热衷于探索新技术的小伙伴而言,ChatGPT早已超越了抽象的概念,我们对其能力已有所了解.那么,Ch ...

  8. AI时代:推荐引擎正在塑造人类

    We shape our tools and afterwards our tools shape us. ------Marshall McLuhan 麦克卢汉说:"我们塑造了工具,反过来 ...

  9. 小冰拉开人生第二幕:AI时代的“Office”问世,你的虚拟男友“复活”了

    作者 | Just 出品 | AI科技大本营(ID:rgznai100) 2014年,小冰正式推出第一代产品,以对话式聊天机器人形式迅速积累训练数据.2020年8月20日,已从微软独立分拆的小冰团队宣 ...

最新文章

  1. (用微信扫的静态链接二维码)微信native支付模式官方提供的demo文件中的几个bug修正...
  2. Linux C编程--进程介绍2--exec函数
  3. 115.什么是SHELL
  4. pytorch基础函数学习
  5. js+php聊天程序
  6. 【万众期待】左盟主688页QT教程震撼发布!88个例程,一大波酷炫UI+项目实战案例来袭,让您久等了!!!...
  7. No ‘Access-Control-Allow-Origin‘ header is present on the requested resource.
  8. pythonscipy教程_Python学习教程(Python学习路线):Python—SciPy精讲
  9. android跑马灯代码,Android中实现跑马灯效果
  10. cocos creator 游戏框架
  11. 10个炫酷特效的网页写法(附源码),拿去就能用,nice
  12. 双参数cfar c语言代码,一种多目标环境下的SAR图像双参数CFAR检测方法与流程
  13. 虚拟机启动黑屏_模拟器启动失败解决方法
  14. 【方法】如何提高专注能力
  15. 二元线性方程组与二阶行列式
  16. 随机漫步与有效市场假说
  17. 华为云数据库VS自建数据库,上“云”不是智商税
  18. 分布式对象存储服务器minio
  19. 如何缩小pdf的大小?如何将pdf文件变小一点?
  20. c语言项目过期什么意思,vs2010为什么总显示此项目已过期 XP系统

热门文章

  1. 用bert来训练quoras question pairs的代码仓
  2. 冯·诺伊曼奖得主Jorge Nocedal:增强学习中零阶优化方法及其应用(附演讲视频和PPT)
  3. 智源重大研究方向“智能信息检索与挖掘”发布会(活动报名)
  4. 什么样的数学问题可以“下金蛋”?
  5. 一键解锁解题秘籍,从向作者提问开始
  6. 程序员,勿让岁月偷走你年轻的秀发!
  7. Python 之父:Python 4.0 可能不会来了
  8. CIKM 2020 | 如何更为合适地评测推荐算法? Top-N物品推荐算法评测设置回顾
  9. 独家 | 准备数据时如何避免数据泄漏
  10. 原创 | 从席卷全球的“刷脸”乱象,看国内人脸识别立法方向