数据挖掘技术具有哪些特点?
数据挖掘源自《从数据库中发现知识》(缩写为KDD)。它首次出现在1989年8月在底特律举行的第十一届国际联合人工智能会议上。为了统一理解,Fayyad,Piatetsky-Shapiro和Smyth在权威文章集《知识发现与数据进展》中给出了KDD和数据挖掘的最新定义。从中总结了1996年该领域的进展,并予以区分:
KDD的定义是:KDD是从数据中识别有效,新颖,潜在有用且最终可以理解的模式的过程。
数据挖掘的定义是:数据挖掘是KDD中的一步,它使用特定算法在可接受的计算效率限制内生成特定模式。
数据挖掘技术的特点
1.基于大量数据:不是说无法挖掘小数据量。实际上,大多数数据挖掘算法都可以在较小的数据量上运行并获得结果。但是,一方面,过小的数据量可以通过手动分析来总结,另一方面,小数据量通常不能反映现实世界的一般特征。
2.非平凡性:所谓非平凡的意思是指所挖掘的知识是不简单的。一定不能与著名体育评论员所说的相似:“经过我的计算,直到比赛结束我才发现了一个有趣的现象。本届世界杯的进球数和失球数都是相同的。非常巧合!”这种知识。这似乎没有必要,但是许多不了解业务知识的数据挖掘新手经常会犯此错误。
3.隐含性:数据挖掘是发现数据深处的知识,而不是直接出现在数据表面的信息。常用的BI工具(例如亿信BI和豌豆BI)完全可以让用户找到此信息。
4.新奇性:挖掘的知识以前应该是未知的,否则仅是为了验证业务专家的经验。只有新知识才能帮助公司获得进一步的洞察力。
5.价值性:挖掘的结果必须为企业带来直接或间接的利益。有人说数据挖掘只是“杀龙技术”。它看起来牛气哄哄,但没有用。这只是一个错误的想法。不可否认的是,在某些数据挖掘项目中,由于缺乏明确的业务目标,或者由于数据质量不足,或者由于人们抵制不断变化的业务流程,又或者由于挖掘人员缺乏经验,都会导致结果不佳甚至根本没有效果。但是,大量成功的案例也证明了数据挖掘确实可以成为提高效率的武器。
数据挖掘技术具有哪些特点?相关推荐
- 数据挖掘技术在出行体验上的应用!
桔妹导读:每天滴滴都会为上千万人提供出行服务,在这一过程中积累了海量轨迹数据.这些轨迹数据来自于公共服务,本文介绍如何利用这些数据回馈大众,改善出行体验. 1. 背景 首先简要介绍一下什么是数据挖掘 ...
- 数据挖掘技术简介[转]
关键词: 关键词:数据挖掘 数据集合 1. 引言 数据挖掘(Data Mining)是从大量的.不完全的.有噪声的.模糊的.随机的数据中提取隐含在其中的.人们事先不知道的.但又是潜在有用的信息和 ...
- [转载]基于数据挖掘技术入侵检测系统研究
[--- 资料是从免费网站上获取的,上载在这里,只为交流学习目的,文章原作者保留所有权力, 如本博客的内容侵犯了你的权益,请与以下地址联系,本人获知后,马上删除.同时本人深表歉意,并致以崇高的谢意! ...
- 空间数据挖掘技术理论及方法
葛继科(西南农业大学信息学院 400716) 摘要 本文简要论述了空间数据库技术及空间数据挖掘技术的理论及特点,分析了空间数据挖掘技术的层次.方法,并重点介绍了当前常用的分类.聚类.关联规则等空 ...
- 数据挖掘技术在信用卡业务中的应用及实例分析
信用卡业务具有透支笔数巨大.单笔金额小的特点,这使得数据挖掘技术在信用卡业务中的应用成为必然.国外信用卡发卡机构已经广泛应用数据挖掘技术促进信用卡业务的发展,实现全面的绩效管理.我国自1985年发行第 ...
- 数据挖掘技术有哪几种
数据挖掘涉及"处理数据和识别信息中的模式和趋势",数据挖掘技术帮助专业人员了解可用数据集,本文将会介绍5种主要的数据挖掘技术,这些技术可以为企业和其他组织提供描述性和预测性的能力. ...
- 【进阶数据挖掘技术】进阶数据挖掘技术介绍
数据挖掘技术的功能分类 描述性的数据挖掘(Descriptive Data Mining(Unsupervised Learning无监督学习,不需要目标值)) Association Rules(关 ...
- 数据挖掘技术的算法与应用读书报告
数据挖掘作为现在比较有用的支持决策系统的一种手段有着广泛的应用.其有很多种方法,本文主要基于关联规则类等相关问题进行论述.按照挖掘过程进行组织.首先,有数据仓库的建立和数据挖掘的概述.其次是关联规则的 ...
- 云平台 物联网 概念 数据挖掘技术
[关键词]云平台 物联网 概念 数据挖掘技术 物联网是现代科学技术发展的产物,它的出现给信息产 物联网在现实生活中已经被普遍运用,其涉及的领域包 景观照明管控.老人护理.花卉栽培.敌情侦查. 1 ...
最新文章
- [精]Odoo 8.0深入浅出开发教程-模块开发基础
- stm32采集脉冲信号_STM32 TIM 编码器模式采集编码器信号
- 他89岁,拿下人生第3个博士学位,横跨医学物理学,只为“实现儿时梦想”
- python退出mainloop_python - Python Turtle mainloop()的用法 - 堆栈内存溢出
- php框架m方法详细,Thinkphp框架中D方法与M方法的区别是什么
- Java 内存泄露总结
- 【计蒜客信息学模拟赛1月月赛 - D】Wish(dp计数,数位)
- Laravel 中asset 函数支持https 协议
- CentOS 7 上搭建 Nacos Cluster 集群
- ConcurrentHashMap与HashTable的区别
- iphone怎么换手机铃声?只需要一招 iRingg
- jQuery获取iframe中页面的高度
- 高可用之2——存储b
- Halcon 3D 计算3D模型的3D表面法线
- 连接Charles后,手机无法上网
- 从入门到头秃周末休闲赛4
- ArcGIS创建缓冲区并相交融合
- 课题组王猛的论文被遥感领域顶级期刊 IEEE TGRS 录用
- 9.leetcode题目189: Rotate Array
- fm2008 数据的计算方法