机器学习、数据挖掘及其他

在本书中,我们不断地提及“智能”,到底什么是“智能”?我们说的是人工智能吗?或者是机器学习?它跟数据挖掘和软计算有什么关系?在学术界,对于本书中所介绍的内容的精确定义也已经争论了好几年。从实践的角度看,这些概念并没有实质性的区别,更多的是指应用环境的不同。本书融合了上述所有领域的精华,让我们逐个来看看吧。

以其首字母缩写AI而广为人知的人工智能是一个起源于20世纪50年代的计算领域。最初,AI的目标是极具野心的,试图开发出能像人类一样思考的机器(Russell and Norvig, 2002; Buchanan, 2005)。随着时间的推移,目标变得更加可行和具体。遥不可及的目标不得不屈服于残酷的现实,但是我们之前提及的很多领域都源自人工智能,比如机器学习、数据挖掘、软计算等。

现在,即使是最先进的计算智能系统也无法理解四岁小孩所阅读的小故事。所以,如果我们无法让计算机“思考”,是否能让计算机“学习”呢?可以教会计算机根据动物的特征来判断物种吗?识别不良的次级房贷呢?更复杂的事情,诸如语音识别并用自然语言答复,计算机能做到吗?所有这些问题的答案都是肯定的。然而你有可能会好奇,“这些问题到底说明了什么?”。解决上面这些问题,一个最简单的方法就是在计算机中构建一个庞大的数据表,把所有可能的问题的答案都存放在里面,然后在回答问题时只需在表中搜索现成的答案即可。

当然,这个查询数据表的方法是可行的,但其中也有一些问题。首先,在实际的产品系统中,包含所有问题和答案的表肯定是非常大的。所以,从效率的角度考虑,这肯定不是一个最优的解决方案。其次,如果数据库中没有某个问题的答案,就无法给出回答,如果真有用户问这些问题,你就只能用“敏感词”来搪塞他了。最后,还必须安排人来构建和维护这个查询表,而且随着表的增长,所需的人数也会不断增长,这估计会让公司的财务部门比较恼火。所以,查询表并不是一个好办法,我们需要更好的解决方案。

机器学习指的是软件系统能从已有的经验中抽象出普遍的规则,然后利用这些规则回答各种问题,包括曾经遇到过的和不曾见过的。有些算法对于人类是透明的,意思就是说,人类可以理解算法所抽象出来的规则。透明算法的典型例子有决策树,以及所有基于规则的学习方法。还有一类算法对人类是不透明的,例如,神经网络和支持向量机(SVM)就属于这一类算法。

时刻要记住,跟人类智能一样,机器智能也是不可靠的。在智能应用领域,你将学会如何处理不确定性和模糊性。就像真实世界一样,所有问题的答案都有一个可信度,而不是绝对可靠的。虽然在我们的日常生活中,我们总是简单地假设某些事情是一定会发生的。正因为如此,在使用智能应用时,我们需要解决可信度、有效性以及错误代价等方面的问题。

本文节选自《智能WEB算法》一书。

图书详细信息:http://www.cnblogs.com/broadview/archive/2011/08/19/2145944.html

机器学习、数据挖掘及其他相关推荐

  1. 机器学习数据挖掘笔记_14(GMM-HMM语音识别简单理解)

    为了对GMM-HMM在语音识别上的应用有个宏观认识,花了些时间读了下HTK(用htk完成简单的孤立词识别)的部分源码,对该算法总算有了点大概认识,达到了预期我想要的.不得不说,网络上关于语音识别的通俗 ...

  2. 常用的机器学习数据挖掘知识点【转】

    转自: [基础]常用的机器学习&数据挖掘知识点 Basis(基础): MSE(Mean Square Error 均方误差),LMS(LeastMean Square 最小均方),LSM(Le ...

  3. Python 网页爬虫 文本处理 科学计算 机器学习 数据挖掘兵器谱 - 数客

    曾经因为NLTK的缘故开始学习Python,之后渐渐成为我工作中的第一辅助脚本语言,虽然开发语言是C/C++,但平时的很多文本数据处理任务都交给了Python.离开腾讯创业后,第一个作品课程图谱也是选 ...

  4. python爬虫数据挖掘_Python网页爬虫文本处理科学计算机器学习数据挖掘兵器谱...

    转载自"我爱自然语言处理":http://www.52nlp.cn,已获得授权.更多内容可见公众号:"牛衣古柳"(ID:Deserts-X). 周末时看到这篇不 ...

  5. Python 网页爬虫 文本处理 科学计算 机器学习 数据挖掘兵器谱

    Python 网页爬虫 & 文本处理 & 科学计算 & 机器学习 & 数据挖掘兵器谱 2015-04-27 程序猿 程序猿 来自:我爱自然语言处理,www.52nlp. ...

  6. 【干货】Python爬虫/文本处理/科学计算/机器学习/数据挖掘兵器谱

    2019独角兽企业重金招聘Python工程师标准>>> 曾经因为NLTK的缘故开始学习Python,之后渐渐成为我工作中的第一辅助脚本语言,虽然开发语言是C/C++,但平时的很多文本 ...

  7. 常见的机器学习数据挖掘知识点之Basis

    常见的机器学习&数据挖掘知识点之Basis SSE(Sum of Squared Error, 平方误差和) SSE=∑i=1n(Xi−X⎯⎯⎯)2 SSE=\sum_{i=1}^{n}(X_ ...

  8. 非CS专业小硕的机器学习/数据挖掘岗位秋招经验

    此文转自牛客网,作者是浙大控制的硕士网名叫"我是水果" 原贴网址https://www.nowcoder.com/discuss/19379?type=0&order=0& ...

  9. 【2022春实习】百度笔试记录(机器学习/数据挖掘/自然语言)

    20220412百度笔试-机器学习/数据挖掘/自然语言 文章目录 20220412百度笔试-机器学习/数据挖掘/自然语言 一.选择题30道(60分) 二.问答题1道(20分) 三.系统设计题1道(30 ...

  10. [机器学习数据挖掘]机器学习实战决策树plotTree函数完全解析

    [机器学习&数据挖掘]机器学习实战决策树plotTree函数完全解析 http://www.cnblogs.com/fantasy01/p/4595902.html点击打开链接 import ...

最新文章

  1. 【Linux】Linux 简单操作指令之磁盘管理
  2. Mocha BSM基础架构管理——灵活的网络拓扑展现
  3. Linux修改主机名永久生效
  4. 元计算:《元计算破解生命密码》听课笔记
  5. mysql改为sql_项目需求变更:Mysql改为SqlServer
  6. iOS-----------关于组件化
  7. OSSIM学习-英汉对照注释
  8. java linux 调用32位so_从linux源码看socket(tcp)的timeout
  9. 测试流程图_入职两年银行测试员经验总结:我是如何帮人们“避雷”的?
  10. 为什么网站服务器不存在了,百度数据中有网站不存在的路径是什么原因
  11. hibernate的一级缓存问题
  12. 23西南大学电子信息907专硕考研经验贴
  13. 【Latex格式】双栏双图左右并排有小标题、上下并列有小标题
  14. 海龟画图 python太阳花_《海》字意思读音、组词解释及笔画数 - 新华字典 - 911查询...
  15. 十年技术进阶路:让我明白了三件要事。关于如何做好技术 Team Leader?如何提升管理业务技术水平?(10000字长文)...
  16. linux下 部署调用SAP接口
  17. 使用openCV画出一幅图像的直方图
  18. python地图实例_利用pyecharts实现地图可视化的例子
  19. 欧瑞变频器故障码表_尼得科变频器故障代码处理一览表
  20. 回顾林丹的职业生涯,用python看看粉丝都说了些什么!

热门文章

  1. Activity的生命周期是谁调用的?
  2. sqlserver 把两个sql查询语句查询出来的两张表合并成一张表
  3. Linux下防火墙iptables用法规则详及其防火墙配置
  4. Python中’__main__’模块的作用
  5. Linux下使用ping出现destination is unreachable的问题可能性
  6. 神经网络学习笔记-02-循环神经网络
  7. AX2009报表打印固定长度Barcode条码
  8. YII2 载入默认值 loadDefaultValues
  9. MIPS(loongson)linux 中添加系统调用
  10. MongoDB:利用官方驱动改装为EF代码风格的MongoDB.Repository框架 五 --- 为ListMongoDBRef增加扩展方法...