【数据挖掘】数据挖掘简介 ( 6 个常用功能 | 数据挖掘结果判断 | 数据挖掘学习框架 | 数据挖掘分类 )
文章目录
- I . 数据挖掘 功能
- II . 数据挖掘 结果判断
- III . 数据挖掘 学习框架
- IV . 数据挖掘 分类
I . 数据挖掘 功能
1 . 概念描述 ( Concept Description ) : 主要进行 表征 与 判断 操作 , 概括 , 总结 , 对比 数据的特征 ;
如 : 对产品分类 , 对真实世界进行描述 ;
2 . 关联分析 ( Association ) : 分析两个事物的发生的 相关性 , 因果性 ;
如 : 尿布 与 啤酒 经常被一起购买 ( 相关性分析 ) ; 银行对申请贷款的人的信用评级进行相关性分析 ;
3 . 分类和预测 ( Classification and Prediction ) : 数据挖掘中的重要部分 , 构造用于 描述 / 区分 对 未来预测 的 分类 / 概念 的模型 ;
有监督学习过程 : 分类和预测是典型的有监督学习的过程 , 先给一组训练数据 , 根据该数据进行训练 , 完成后对未知的数据进行预测 ;
如 : 预测票房 , 疾病 ; 预测未知数值 ; 根据气候对国家分类 ; 根据汽车油耗对汽车分类 ;
4 . 聚类分析 ( Cluster Analysis ) : 将数据分组 , 使类内部数据相似度最大化 , 使类之间数据的相似度最小化 ;
数据类型标签未知 : 将数据分组形成新类 , 分析找出分类的依据 ;
5 . 异常检测 ( Outlier Analysis ) :
① 异常值 ( Outlier ) : 不符合一般行为特点的数据 ;
② 异常值作用 : 该数据很重要 , 用于罕见事件分析 , 欺诈检测 ;
6 . 趋势与演化分析 ( Trend and Evolution Analysis ) : 趋势与偏差 , 如回归分析 ; 序列模式挖掘 , 周期性分析 ; 基于相似性的分析 ;
II . 数据挖掘 结果判断
数据挖掘结果判断 : 数据挖掘得出的 知识 / 模式 , 如何判断得出的结果是否有效 ;
① 客观判断方法 : 通过科学计算进行判断是否正确 , 该计算基于 模式 的t 统计和结构 ; ( 学术界判断 )
② 主观判断方法 : 基于人的个人感觉 , 根据该结果是否盈利 , 客户 ( 甲方 ) 给出评判结果 ; ( 工业界判断 )
III . 数据挖掘 学习框架
1 . 数据挖掘技术 ( 重点 ) : 聚类分析 , 异常检测 , 分类 , 关联规则分析 , 序列模式分析 , 数据方体与数据仓库 ;
2 . 数据挖掘原理 : 数据库技术 ( 索引 , 数据压缩 , 数据结构 ) , 人工智能 , 机器学习 , 统计学 , 信息论 , 理论计算 ( 近似 / 随机 算法 ) , 数学规划 , 几何计算 ;
3 . 数据挖掘应用 : CRM , 搜索分析 , 网络安全 , 生物信息分析 …
IV . 数据挖掘 分类
1 . 根据输入数据类型分类 :
① 根据 数据模型 分类 : 根据数据模型分类 , 分类成 关系 , 面向对象 , 对象 - 关系 , 数据仓库 等不同类型的数据模型的 数据挖掘 ;
② 根据 数据类型 分类 : 时间数据 , 空间数据 , 文本数据 , 音视频多媒体数据 , WEB 数据 等类型的数据挖掘 ;
2 . 根据输出数据类型分类 :
① 根据结果类型分析 : 特征分析 , 关联分析 , 聚类分析 , 偏差分析 , 异常检测分析 , 趋势和演化分析 等类型的 数据挖掘 ;
② 根据挖掘的知识的粒度与抽象级别分类 : 高抽象的泛化知识 , 原始层的知识 , 多层的知识 ;
3 . 根据采用的技术分类 : 如 机器学习 , 模式识别 , 神经网络 , 可视化 等技术类型的 数据挖掘 ;
4 . 根据应用领域分类 : 如 金融 , 生物 , 电讯 等领域的数据挖掘 ;
【数据挖掘】数据挖掘简介 ( 6 个常用功能 | 数据挖掘结果判断 | 数据挖掘学习框架 | 数据挖掘分类 )相关推荐
- Py之scikit-learn:机器学习sklearn库的简介、六大基本功能介绍(数据预处理/数据降维/模型选择/分类/回归/聚类)、安装、使用方法(实际问题中如何选择最合适的机器学习算法)之详细攻略
Py之scikit-learn:机器学习sklearn库的简介(组件/版本迭代).六大基本功能介绍(数据预处理/数据降维/模型选择/分类/回归/聚类).安装.使用方法(实际问题中如何选择最合适的机器学 ...
- 30个学习大数据挖掘的重要知识点!
https://www.jianshu.com/p/2441b69794b0 下面是一些关于大数据挖掘的知识点,今天和大家一起来学习一下. 1. 数据.信息和知识是广义数据表现的不同形式. 2. 主要 ...
- 转载【数据集】计算机视觉,深度学习,数据挖掘数据集整理
金融 美国劳工部统计局官方发布数据 上证A股日线数据,1999.12.09 至 2016.06.08,前复权,1095支股票 深证A股日线数据,1999.12.09 至 2016.06.08,前复权, ...
- 统计学习基础:数据挖掘、推理和预测_数据挖掘——智能财务进阶之梯(含视频、PPT)...
6月20日,由上海国家会计学院主办,用友.元年科技.中兴新云.金蝶集团.浪潮集团联合主办的"信息技术赋能会计融合创新"高峰论坛暨2020年影响中国会计人员的十大信息技术评选结果发布 ...
- 06-机器学习.数据分析.数据挖掘的区别于联系
数据分析:数据分析是指用适当的统计分析方法对手机的大量数据进行分析,并提取有用的信息,以及形成结论,从而对数据进行详细的研究和概括过程.在实际工作中,数据分析可帮助人们做出判断;数据分析一般而言可以分 ...
- 统计学,机器学习,深度学习,数据挖掘的联系
1.数据挖掘(Data Mining)顾名思义就是从海量数据中"挖掘"隐藏信息,按照教科书的说法,这里的数据是"大量的.不完全的.有噪声的.模糊的.随机的实际应用数据&q ...
- 面向个性化学习的数据挖掘方法
(持续更新ing) 面向个性化学习的数据挖掘方法,研究内容分为以下三大类 1.练习深度表征方法及应用 2.认知诊断分析(重点在于动态认知诊断分析) 在教育心理学中,认知诊断是利用学生做题的历史记录来诊 ...
- AI:人工智能领域之AI基础概念术语之机器学习、深度学习、数据挖掘中常见关键词、参数等5000多个单词中英文对照(绝对干货)
AI:人工智能领域之AI基础概念术语之机器学习.深度学习.数据挖掘中常见关键词.参数等5000多个单词中英文对照(绝对干货) 导读 本博主基本收集了网上所有有关于ML.DL的中文解释词汇,机 ...
- 《数据挖掘》学习框架
博主是学习了数据挖掘课后,结合教材和老师的课件,总结了这门课整体的一个知识点框架,还算比较详细,希望大家在学习数据挖掘的时候能够给大家一个参考,以及知识点的查漏补缺.有遗漏和错误的地方多谢指正. 参考 ...
最新文章
- Data - 深入浅出学统计 - 上篇
- R语言使用timeROC包计算存在竞争情况下的生存资料多个标记物在相同时间下的cox及协变量分析AUC值、并可视化多个标记物在相同时间下的ROC值、多指标的ROC曲线(Time-dependent R
- mysql等价语句是_Mysql基本语句(个人笔记)
- php 实现对称加密算法,PHP实现简单的对称加密和解密方法
- 居然又要出一部关于程序员的剧!你会追么?
- 【系统平台】模拟器-通道-模型-图形配置
- mybatis 批量将list数据插入到数据库
- 特征值与特征向量_机器学习和线性代数 - 特征值和特征向量
- JDK12的新特性:CompactNumberFormat
- ExtJs-GridPanel简单的增删改
- (转)MOMO的Unity3D研究院之深入理解Unity脚本的执行顺序(六十二)
- ElasticSearch快速入门二(Restful介绍)
- 正则的文字替换和字符串的替换哪个快_JavaScript正则表达式怎么用?
- css中的一些问题及解决方法
- Openstack概论
- Java SE作业:判断一个字符串是否是视频文件
- 让你的AIR程序自动检测更新,并自动下载、更新到新版本。
- 人口普查中应该具备的计算机知识,人口普查知识问答③
- 百度NLP架构与应用
- 美国大通胀:谁来扛旗?
热门文章
- 为什么JS是单线程?JS中的Event Loop(事件循环)?JS如何实现异步?setimeout?
- mysql时间日期操作
- BZOJ1082: [SCOI2005]栅栏
- 聚集索引和非聚集索引实例
- linux kernel 2.6.36 编译升级
- 非常好用的网站状态监控服务:SiteUpTime,监控你的Http/Mail/Ping etc.
- .net core mvc部署到IIS导出Word 提示80070005拒绝访问
- Spring.Net学习
- GVIM工具之gvim的配色方式
- (原创)基于ZedBoard的Webcam设计(二):USB摄像头图片采集+QT显示