文章目录

  • I . 数据挖掘 功能
  • II . 数据挖掘 结果判断
  • III . 数据挖掘 学习框架
  • IV . 数据挖掘 分类

I . 数据挖掘 功能


1 . 概念描述 ( Concept Description ) : 主要进行 表征 与 判断 操作 , 概括 , 总结 , 对比 数据的特征 ;

如 : 对产品分类 , 对真实世界进行描述 ;

2 . 关联分析 ( Association ) : 分析两个事物的发生的 相关性 , 因果性 ;

如 : 尿布 与 啤酒 经常被一起购买 ( 相关性分析 ) ; 银行对申请贷款的人的信用评级进行相关性分析 ;

3 . 分类和预测 ( Classification and Prediction ) : 数据挖掘中的重要部分 , 构造用于 描述 / 区分 对 未来预测 的 分类 / 概念 的模型 ;

有监督学习过程 : 分类和预测是典型的有监督学习的过程 , 先给一组训练数据 , 根据该数据进行训练 , 完成后对未知的数据进行预测 ;

如 : 预测票房 , 疾病 ; 预测未知数值 ; 根据气候对国家分类 ; 根据汽车油耗对汽车分类 ;

4 . 聚类分析 ( Cluster Analysis ) : 将数据分组 , 使类内部数据相似度最大化 , 使类之间数据的相似度最小化 ;

数据类型标签未知 : 将数据分组形成新类 , 分析找出分类的依据 ;

5 . 异常检测 ( Outlier Analysis ) :

① 异常值 ( Outlier ) : 不符合一般行为特点的数据 ;

② 异常值作用 : 该数据很重要 , 用于罕见事件分析 , 欺诈检测 ;

6 . 趋势与演化分析 ( Trend and Evolution Analysis ) : 趋势与偏差 , 如回归分析 ; 序列模式挖掘 , 周期性分析 ; 基于相似性的分析 ;

II . 数据挖掘 结果判断


数据挖掘结果判断 : 数据挖掘得出的 知识 / 模式 , 如何判断得出的结果是否有效 ;

① 客观判断方法 : 通过科学计算进行判断是否正确 , 该计算基于 模式 的t 统计和结构 ; ( 学术界判断 )

② 主观判断方法 : 基于人的个人感觉 , 根据该结果是否盈利 , 客户 ( 甲方 ) 给出评判结果 ; ( 工业界判断 )

III . 数据挖掘 学习框架


1 . 数据挖掘技术 ( 重点 ) : 聚类分析 , 异常检测 , 分类 , 关联规则分析 , 序列模式分析 , 数据方体与数据仓库 ;

2 . 数据挖掘原理 : 数据库技术 ( 索引 , 数据压缩 , 数据结构 ) , 人工智能 , 机器学习 , 统计学 , 信息论 , 理论计算 ( 近似 / 随机 算法 ) , 数学规划 , 几何计算 ;

3 . 数据挖掘应用 : CRM , 搜索分析 , 网络安全 , 生物信息分析 …

IV . 数据挖掘 分类


1 . 根据输入数据类型分类 :

① 根据 数据模型 分类 : 根据数据模型分类 , 分类成 关系 , 面向对象 , 对象 - 关系 , 数据仓库 等不同类型的数据模型的 数据挖掘 ;

② 根据 数据类型 分类 : 时间数据 , 空间数据 , 文本数据 , 音视频多媒体数据 , WEB 数据 等类型的数据挖掘 ;

2 . 根据输出数据类型分类 :

① 根据结果类型分析 : 特征分析 , 关联分析 , 聚类分析 , 偏差分析 , 异常检测分析 , 趋势和演化分析 等类型的 数据挖掘 ;

② 根据挖掘的知识的粒度与抽象级别分类 : 高抽象的泛化知识 , 原始层的知识 , 多层的知识 ;

3 . 根据采用的技术分类 : 如 机器学习 , 模式识别 , 神经网络 , 可视化 等技术类型的 数据挖掘 ;

4 . 根据应用领域分类 : 如 金融 , 生物 , 电讯 等领域的数据挖掘 ;

【数据挖掘】数据挖掘简介 ( 6 个常用功能 | 数据挖掘结果判断 | 数据挖掘学习框架 | 数据挖掘分类 )相关推荐

  1. Py之scikit-learn:机器学习sklearn库的简介、六大基本功能介绍(数据预处理/数据降维/模型选择/分类/回归/聚类)、安装、使用方法(实际问题中如何选择最合适的机器学习算法)之详细攻略

    Py之scikit-learn:机器学习sklearn库的简介(组件/版本迭代).六大基本功能介绍(数据预处理/数据降维/模型选择/分类/回归/聚类).安装.使用方法(实际问题中如何选择最合适的机器学 ...

  2. 30个学习大数据挖掘的重要知识点!

    https://www.jianshu.com/p/2441b69794b0 下面是一些关于大数据挖掘的知识点,今天和大家一起来学习一下. 1. 数据.信息和知识是广义数据表现的不同形式. 2. 主要 ...

  3. 转载【数据集】计算机视觉,深度学习,数据挖掘数据集整理

    金融 美国劳工部统计局官方发布数据 上证A股日线数据,1999.12.09 至 2016.06.08,前复权,1095支股票 深证A股日线数据,1999.12.09 至 2016.06.08,前复权, ...

  4. 统计学习基础:数据挖掘、推理和预测_数据挖掘——智能财务进阶之梯(含视频、PPT)...

    6月20日,由上海国家会计学院主办,用友.元年科技.中兴新云.金蝶集团.浪潮集团联合主办的"信息技术赋能会计融合创新"高峰论坛暨2020年影响中国会计人员的十大信息技术评选结果发布 ...

  5. 06-机器学习.数据分析.数据挖掘的区别于联系

    数据分析:数据分析是指用适当的统计分析方法对手机的大量数据进行分析,并提取有用的信息,以及形成结论,从而对数据进行详细的研究和概括过程.在实际工作中,数据分析可帮助人们做出判断;数据分析一般而言可以分 ...

  6. 统计学,机器学习,深度学习,数据挖掘的联系

    1.数据挖掘(Data Mining)顾名思义就是从海量数据中"挖掘"隐藏信息,按照教科书的说法,这里的数据是"大量的.不完全的.有噪声的.模糊的.随机的实际应用数据&q ...

  7. 面向个性化学习的数据挖掘方法

    (持续更新ing) 面向个性化学习的数据挖掘方法,研究内容分为以下三大类 1.练习深度表征方法及应用 2.认知诊断分析(重点在于动态认知诊断分析) 在教育心理学中,认知诊断是利用学生做题的历史记录来诊 ...

  8. AI:人工智能领域之AI基础概念术语之机器学习、深度学习、数据挖掘中常见关键词、参数等5000多个单词中英文对照(绝对干货)

    AI:人工智能领域之AI基础概念术语之机器学习.深度学习.数据挖掘中常见关键词.参数等5000多个单词中英文对照(绝对干货) 导读      本博主基本收集了网上所有有关于ML.DL的中文解释词汇,机 ...

  9. 《数据挖掘》学习框架

    博主是学习了数据挖掘课后,结合教材和老师的课件,总结了这门课整体的一个知识点框架,还算比较详细,希望大家在学习数据挖掘的时候能够给大家一个参考,以及知识点的查漏补缺.有遗漏和错误的地方多谢指正. 参考 ...

最新文章

  1. Data - 深入浅出学统计 - 上篇
  2. R语言使用timeROC包计算存在竞争情况下的生存资料多个标记物在相同时间下的cox及协变量分析AUC值、并可视化多个标记物在相同时间下的ROC值、多指标的ROC曲线(Time-dependent R
  3. mysql等价语句是_Mysql基本语句(个人笔记)
  4. php 实现对称加密算法,PHP实现简单的对称加密和解密方法
  5. 居然又要出一部关于程序员的剧!你会追么?
  6. 【系统平台】模拟器-通道-模型-图形配置
  7. mybatis 批量将list数据插入到数据库
  8. 特征值与特征向量_机器学习和线性代数 - 特征值和特征向量
  9. JDK12的新特性:CompactNumberFormat
  10. ExtJs-GridPanel简单的增删改
  11. (转)MOMO的Unity3D研究院之深入理解Unity脚本的执行顺序(六十二)
  12. ElasticSearch快速入门二(Restful介绍)
  13. 正则的文字替换和字符串的替换哪个快_JavaScript正则表达式怎么用?
  14. css中的一些问题及解决方法
  15. Openstack概论
  16. Java SE作业:判断一个字符串是否是视频文件
  17. 让你的AIR程序自动检测更新,并自动下载、更新到新版本。
  18. 人口普查中应该具备的计算机知识,人口普查知识问答③
  19. 百度NLP架构与应用
  20. 美国大通胀:谁来扛旗?

热门文章

  1. 为什么JS是单线程?JS中的Event Loop(事件循环)?JS如何实现异步?setimeout?
  2. mysql时间日期操作
  3. BZOJ1082: [SCOI2005]栅栏
  4. 聚集索引和非聚集索引实例
  5. linux kernel 2.6.36 编译升级
  6. 非常好用的网站状态监控服务:SiteUpTime,监控你的Http/Mail/Ping etc.
  7. .net core mvc部署到IIS导出Word 提示80070005拒绝访问
  8. Spring.Net学习
  9. GVIM工具之gvim的配色方式
  10. (原创)基于ZedBoard的Webcam设计(二):USB摄像头图片采集+QT显示