引言

1.1 什么是数据挖掘?在你的回答中,针对以下问题:

 a. 它是又一种广告宣传吗?b. 它是一种从数据库、统计学和机器学习发展的技术的简单转换吗?c. 解释数据库技术发展如何导致数据挖掘d. 当把数据挖掘看作知识发现过程时,描述挖掘所涉及的步骤。

回答:

数据挖掘是从大量的、不完全的、有噪声的、模糊的、随机的实际数据中,提取隐含在其中的、人们所不知道的、但又是潜在有用信息和知识的过程。

  a. 数据挖掘不是另一种广告宣传,大规模数据的可利用性以及将大规模数据转化为有用信息的迫切性导致了数据挖掘的兴起,因此数据挖掘可以被看作是信息技术自然演变的结果。b.数据挖掘不是一种从数据库、统计学和机器学习发展的技术的简单转换。从数据库的观点来看,数据挖掘可以看做联机分析处理(OLAP)的高级阶段,通过结合多学科知识(例如统计学、机器学习等)达到更高级的数据分析能力。数据挖掘涉及多学科技术的集成,包括数据库和数据仓库技术、统计学、机器学习、高性能计算、模式识别、神经网络、信息检索等等。c.数据库技术开始于数据收集和数据库创建机制的发展,导致了用于数据管理的有效机制,包括数据存储和检索,查询和事务处理的发展。提供查询和事务处理的大量的数据库系统最终自然地导致了对数据分析和理解的需要。随着计算机技术的发展,推动了数据库和信息产业的发展,快速增长的海量数据收集、存放在大型和大量数据存储库中,没有强有力的工具,理解他们已经远远超出了人的能力,数据挖掘工具应运而生。d.当把数据挖掘视为知识发现过程的一个基本步骤时,涉及步骤如下: 数据清理(一个删除或消除噪声和不一致的数据的过程); 数据集成(多种数据源可以组合在一起); 数据选择(从数据库中提取与分析任务相关的数据); 数据变换(数据变换或统一成适合挖掘的形式,如通过汇总或聚集操作); 数据挖掘(基本步骤也是**最重要的步骤**,使用智能方法提取数据模式); 模式评估(根据某种兴趣度度量,识别表示知识的真正有趣的模式); 知识表示(使用可视化和知识表示技术,向用户提供挖掘的知识)。

  其实,在真正的工程中数据挖掘主要包括:数据的预处理(去重、消噪等)、特征选择(目的为降维等等)、建模方法选择(数据分析方法的选择,根据具体的任务选择不同的分类器或者聚类器或者预测模型等)、模型评估(根绝具体的项目要求选择不同的模型评估方法,比如精确率、召回率等等)、模型的调整(例如调参等等)、模型的确定以及应用。

1.2 给出一个例子,其中数据挖掘对于商务的成功是至关重要的。该商务需要什么数据挖掘功能?它们能够用数据查询处理或这简单的统计技术完成吗?

 回答:

例如捆绑销售(啤酒喝尿布的故事)可以利用关联规则挖掘,找出顾客经常一起购买的商品,那么零售商在安排货物摆放的时候将频繁一起购买的商品摆放在一起,可以有效的提高销售效益。数据查询处理主要应用于数据的查询和信息检索方面,无法实现频繁项集发现功能。同样的,简单的统计技术无法完成大规模数据的分析。

1.3

《数据挖掘概念与技术》第二版 中文版 第一章答案相关推荐

  1. 贝叶斯统计第二版第五章答案_贝叶斯统计第二部分

    贝叶斯统计第二版第五章答案 In this post, I will compare the output of frequentist and Bayesian statistics, and ex ...

  2. 【Git】版本控制管理(第二版) 前言 第一章 第二章

    版本控制管理 前言 第一章 第二章 资源 前言 本书结构 第一章 介绍 总结在开头 1.1 背景 1.2 Git的诞生 1.3 先例 1.4 时间线 第二章 安装Git 2.1 使用Linux上的二进 ...

  3. 从零开始Android游戏编程(第二版) 第一章 搭建开发环境

    第一章 搭建开发环境 难度:容易 工欲善其技,必先利其器.我们要做的第一件事就是搭建Android开发环境.本文只介绍Windows下的安装方法,Linux下的安装方法请参考官方网站的介绍. 与PC编 ...

  4. MICK-SQL基础教程(第二版)第一章

    本书代码下载 第一章 DBMS的种类 层次数据库(Hierarchical Database,HDB) 把数据通过层次结构(树形结构)的方式表现出来 关系数据库(Relational Database ...

  5. 计算机文化基础(高职高专版 第十一版)第一章答案

    1.什么是信息?什么是数据?数据和信息有什么不同? 1)信息是自然界.人类社会和人类思维活动中普遍存在的一切物质和事物的属性.2)数据:指存储在某种媒体上可以加以鉴别的符号资料.3)同一个信息可以用不 ...

  6. 《快学scala第二版》第一章 练习答案

    1.1 在Scala REPL中键入3.然后按Tab键.有哪些方法可以被应用? 1.2 在Scala REPL中,计算3的平方根,然后再对该值求平方.现在,这个结果与3相差多少?(提示:res变量是你 ...

  7. python语言程序设计基础第二版第七章答案-Python核心编程第二版 第七章课后答案...

    注:我使用的python3.5. 其中range和xrange,input和raw_input已经合并 7-1.字典方法.哪个字典方法可以用来把两个字典合并到一起. dict.update(dict2 ...

  8. python语言程序设计基础第二版第六章答案-python语言程序设计基础(第二版)第五章答案随笔...

    模板模式与策略模式/template模式与strategy模式/行为型模式 模板模式 模版模式,又被称为模版方法模式,它可以将工作流程进行封装,并且对外提供了个性化的控制,但主流程外界不能修改,也就是 ...

  9. python语言程序设计基础第二版答案-python语言程序设计基础(第二版)第五章答案随笔...

    模板模式与策略模式/template模式与strategy模式/行为型模式 模板模式 模版模式,又被称为模版方法模式,它可以将工作流程进行封装,并且对外提供了个性化的控制,但主流程外界不能修改,也就是 ...

最新文章

  1. 网络协议 19 - RPC 协议:远在天边近在眼前
  2. 程序员如何打造个人品牌?
  3. CUDA系列学习(五)GPU基础算法: Reduce, Scan, Histogram
  4. (Unity4.7)assetbundle 坑爹总结
  5. 红黑树 RBTree
  6. 用ASP连接DBF、DBC、MDB、Excel、SQL Server型数据库的方法:
  7. 金山打字通五笔介绍及讲解
  8. Si4438, Si4432, Sx1278, Sx1276, Sx1212无线数传模块简单介绍
  9. python与开源gis空间分析_Python 与开源GIS:数据处理、空间分析与地图制图
  10. win10系统安装教程(U盘PE+UEFI安装)
  11. 谷歌学术高级搜索技巧
  12. 编码中的硬回车与软回车
  13. 杂七杂八(4): win10设置启动时创建系统还原点
  14. 三星android文件传输,最好的三星Galaxy S8管理器:如何将文件传输到三星Galaxy S8...
  15. TP6 workman安装踩坑
  16. RoundedImageView的使用
  17. 评测:24英寸iMac与27英寸iMac详细对比
  18. 能去百度、滴滴、阿里的算法工程师到底有多牛?听说个个都是人才,说话又好听...
  19. spring-cloud-security
  20. 通过不同的查询方式解决笛卡尔集问题

热门文章

  1. 第13章 面向对象编程
  2. 步步高vivo y35a官方刷机包原厂手机线刷包附教程
  3. STC89C52驱动SH1106芯片点亮OLED问题点总结
  4. Pod 常见错误及故障排查
  5. 移动外勤 外勤管理专家
  6. 金彩教育:详情页怎么做才能吸引消费者
  7. 「Adobe国际认证」广告牌的设计也可以引人注目,但需接受这些设计建议
  8. 微信公众号 模版消息详细教程(附代码)
  9. Exception:java.lang.IllegalArgumentException: invalid comparison
  10. java 蓝桥杯 黄金队列