数据采集策略:数据挖掘与统计学的一个区别

这个观点来自Hand等人的《数据挖掘原理》(机工,2003)。

说数据挖掘是对已经存在的数据进行分析(比如说“[原有]数据库中的知识发现”,KDD),而统计会为了回答某一个特定问题而专门去采集数据。也就是说,数据挖掘所分析处理的数据,不是为挖掘本身而收集的。

企业为了别的目的建立数据库,为了挖掘,它再从数据库的基础上建立起为分析服务的数据仓库。

转自:http://johnthu.spaces.live.com/blog/cns!2053CD511E6D5B1E!299.entry

数据采集策略:数据挖掘与统计学的一个区别相关推荐

  1. 数据挖掘时功能和一个聚类分析应用案例

    数据挖掘时功能和一个聚类分析应用案例 数据挖掘的常用方法和数据挖掘的重要功能(出自MBA智库百科).当然,横看成岭侧成峰,这些常用方法和重要功能也许并不完全正确或完整.除此以外,笔者尝试学习了SMAR ...

  2. 一文读懂机器学习、数据科学、人工智能、深度学习和统计学之间的区别

    在这篇文章中,数据科学家与分析师 Vincent Granville 明晰了数据科学家所具有的不同角色,以及数据科学与机器学习.深度学习.人工智能.统计学.物联网.运筹学和应用数学等相关领域的比较和重 ...

  3. 数据挖掘与机器学习关系与区别

    数据挖掘与机器学习关系与区别 ps:本篇文章主要阐述最近在数据挖掘.机器学习等方面的学习心得,或许不太全面,仅供自己归纳总结. 主要参照 周志华老师的:机器学习与数据挖掘 一文.有兴趣的可以自行百度, ...

  4. 数据挖掘与数据分析两者的区别

    随着大数据爆发式增长,市场上对大数据相关人才的需求与日俱增,导致大数据行业人才需求紧缺,引发了关于大数据的学习浪潮,在这个过程中,人们也会不时将数据分析与数据挖掘的关系混淆,什么是数据挖掘?与数据分析 ...

  5. 策略模式与简单工厂模式区别(转)

    最近一直在抽时间研究设计模式,之前对设计模式也有一定的了解,但是都没有平心静气的去研究过,只是了解了一些皮毛,最近打算再深入研究一下,重新打开了设计模式的数据,对之前的疑问一个个的刨根问底,今天看了简 ...

  6. 策略模式和工厂模式的区别_设计模式系列 — 策略模式

    点赞再看,养成习惯,公众号搜一搜[一角钱技术]关注更多原创技术文章. 本文 GitHub org_hejianhui/JavaStudy 已收录,有我的系列文章. 前言 23种设计模式速记 单例(si ...

  7. 策略模式和工厂模式的区别

    文章目录 策略模式和工厂模式的区别 相似点 差异 用途不一样 关注点不一样 UML图 实例 策略模式和工厂模式的区别 相似点 在模式结构上,两者很相似: 差异 用途不一样 工厂是创建型模式,它的作用就 ...

  8. 【设计模式】策略模式与模板模式的区别

    文章目录 概述 如何区别 参考 概述 策略模式与模板模式在Spring中都广泛存在: JDBCTemplate.RedisTemplate.MongoTemplate等均是典型的模板模式. Sprin ...

  9. AI:几张图理清人工智能与机器学习、知识发现、数据挖掘、统计学、模式识别、神经计算学、数据库之间的暧昧关系

    AI:几张图理清人工智能与机器学习.知识发现.数据挖掘.统计学.模式识别.神经计算学.数据库之间的暧昧关系 目录 几张图理清人工智能与机器学习.知识发现.数据挖掘.统计学.模式识别.神经计算学.数据库 ...

最新文章

  1. 【LC3开源峰会网络技术系列之三】基于JStorm的网络分析平台
  2. Python模块filecmp 文件比较
  3. 人生第一份Offer,国企、私企、外企该选择哪一个?
  4. C# 10 新特性 —— 插值字符串优化
  5. C# 9.0 正式发布了(C# 9.0 on the record)
  6. centos系统linux复制命令行,linux系统CentOS7中find命令使用
  7. MySQL数据库的基本操作命令
  8. java etcd api_在java中如何使用etcd的v2 和v3 api获取配置,并且对配置的变化进行监控和监听...
  9. 【英语学习】【Daily English】U13 Holiday L01 I have been waiting for it for ages!
  10. SubSonic 安装与使用
  11. php商品详情页页面代码,商品详情页是怎么生成的?
  12. python计算圆周率、根据下面的泰勒级数关系式_C语言 计算圆周率 根据下面关系式,求圆周率的值,直到最后一项的值小于给定阈值。...
  13. 惠普重新定义IT基础设施
  14. PHP实现简单的注册页面(正则表达式练习)
  15. 2022-2028全球与中国电池级硫酸锰市场现状及未来发展趋势
  16. 我私藏的那些实用的终端命令行工具
  17. java课程设计 考试系统,java课程设计考试系统.
  18. 云计算工程师必备技能图谱
  19. AVD安卓模拟器黑屏
  20. Linux上的文件类型与默认图标

热门文章

  1. 云炬随笔20211021(2)
  2. python 中map()和lamda的简单实用
  3. ege函数库_基于c++ ege图形库实现五子棋游戏
  4. 用WebBrowser实现HTML界面的应用和交互
  5. 自定义的调试函数clr/c++
  6. delphi virtual dynamic
  7. linux创建进程fork函数和vfork函数
  8. 中国蚁剑的下载、安装与使用
  9. python编程题3
  10. Visual c++6.0 如何自定义一个光标,使其变成字