Atitit 知识发现 艾提拉总结

目录

1. 知识发现 1

1.1. 与数据挖掘的区别与联系 数据挖掘"的一种更广义的说法 2

1.2. 基本任务 3

1.2.1. 数据分类 3

1.2.2. 数据聚类 3

1.2.3. 衰退和预报 3

1.2.4. 关联和相关性 3

1.2.5. 顺序发现 3

1.2.6. 描述和辨别 3

1.2.7. 时间序列分析 4

2. 知识类型 4

2.1. 1)广义型知识(Generalization)。 4

2.2. 2)分类型知识(Classification&Clustering)。 4

2.3. 3)关联型知识(Association)。 4

2.4. 4)预测型知识(Prediction)。 4

2.5. 5)偏差型知识(Deviation)。 4

3. 知识发现的分类 5

3.1. 按挖掘的方法分有数据驱动型、查询驱动型和交互型 5

3.2. 按知识类型分有关联规则、特征挖掘、分类、聚类、总结知识、趋势分析、偏差分析、文本采掘。 5

3.3. 知识发现技术可分为两类:基于算法的方法和基于可视化的方法 。 5

4. 关联技术 5

4.1. 基于算法的方法和基于可视化 6

4.2. Web和搜索引擎 6

4.3. 分类 6

4.4. 数据结构化 标注 属性标准化化 6

  1. 知识发现

编辑 讨论

本词条缺少概述图,补充相关内容使词条更完整,还能快速升级,赶紧来编辑吧!

知识发现是从各种信息中,根据不同的需求获得知识的过程。知识发现的目的是向使用者屏蔽原始数据的繁琐细节,从原始数据中提炼出有效的、新颖的、潜在有用的知识,直接向使用者报告。

知识发现(Knowledge Discovery in Database, KDD),是所谓"数据挖掘"的一种更广义的说法,即从各种媒体表示的信息中,根据不同的需求获得知识。知识发现的目的是向使用者屏蔽原始数据的繁琐细节,从原始数据中提炼出有意义的、简洁的知识,直接向使用者报告。

相关书籍

基于数据库的知识发现(KDD)和数据挖掘还存在着混淆,通常这两个术语替换使用。KDD表示将低层数据转换为高层知识的整个过程。可以将KDD简单定义为:KDD是确定数据中有效的、新颖的、潜在有用的、基本可理解的模式的特定过程。而数据挖掘可认为是观察数据中模式或模型的抽取,这是对数据挖掘的一般解释。虽然数据挖掘是知识发现过程的核心,但它通常仅占KDD的一部分(大约是15% 到25%) 。因此数据挖掘仅仅是整个KDD过程的一个步骤,对于到底有多少步以及哪一步必须包括在KDD过程中没有确切的定义。然而,通用的过程应该接收原始数据输入,选择重要的数据项,缩减、预处理和浓缩数据组,将数据转换为合适的格式,从数据中找到模式,评价解释发现结果

  1. 与数据挖掘的区别与联系 数据挖掘"的一种更广义的说法

中文名

知识发现

外文名

Knowledge Discovery in Database, KDD

知识发现

数据挖掘"的一种更广义的说法

数据分类

数据挖掘研究的重要分支之一

  1. 基本任务

编辑

  1. 数据分类

分类是数据挖掘研究的重要分支之一,是一种有效的数据分析方法。分类的目标是通过分析训练数据集,构造一个分类模型(即分类器),该模型能够把数据库中的数据记录映射到一个给定的类别,从而可以l立用于数据预测。

  1. 数据聚类

当要分析的数据缺乏必要的描述信息,或者根本就无法组织成任何分类模式时,利用聚类函数把一组个体按照相似性归成若干类,这样就可以自动找到类。聚类和分类类似,都是将数据进行分组。但与分类不同的是,聚类中的组不是预先定义的,而是根据实际数据的特征按照数据之间的相似性来定义的。

  1. 衰退和预报

这是一种特殊类型的分类,可以看作是根据过去和当前的数据预测未来的数据状态。通过对用衰减统计技术建模的数字值的预测,学习一种(线性或非线性)功能将数据项映射为一个数字预测变量。

  1. 关联和相关性

是指发现大规模数据集中项集之间有趣的关联或相关关系。关联规则是指通过对数据库中的数据进行分析,从某一数据对象的信息来推断另一数据对象的信息,寻找出重复出现概率很高的知识模式,常用一个带有置信度因子的参数来描述这种不确定的关系。

  1. 顺序发现

通常指确定数据组中的顺序模式。当数据的特定类型的关系已被发现时,这些模式同关联和相关性相似。但对关系基于时间序列的数据组,顺序发现和关联就不同了。概括总结:顺序发现是将数据映射为有关数据组的简练描述的子集或映射为数据库中一组特定用户数据的高度概括的数据。

  1. 描述和辨别

是指发现一组特征规则,其中的每一条都是或者显示数据组的特征或者从对比类中区别试验类的概念的命题。

  1. 时间序列分析

其任务是发现属性值的发展趋向,如从股票价格指数的金融数据、客户数据和医学数据等。它是用来搜寻相似模式以发现和预测特定模式的风险、因果关系和趋势。

  1. 知识类型

编辑

  1. 1)广义型知识(Generalization)。

是根据数据的微观特性发现其表征的、带有普遍性的、高层次概念的、中观或宏观的知识。

  1. 2)分类型知识(Classification&Clustering)。

反映同类事物共同性质的特征型知识和不同事物之间差异型特征知识。用于反映数据的汇聚模式或根据对象的属性区分其所属类别。

  1. 3)关联型知识(Association)。

是反映一个事件和其他事件之间依赖或关联的知识,又称依赖(Dependency)关系。这类知识可用于数据库中的归一化,查询优化等。

  1. 4)预测型知识(Prediction)。

通过时间序列型数据,由历史的和当前的数据去预测未来的情况。它实际上是一种以时间为关键属性的关联知识。

  1. 5)偏差型知识(Deviation)。

通过分析标准类以外的特例、数据聚类外的离群值、实际观测值和系统预测值间的显著差别,对差异和极端特例进行描述。

  1. 知识发现的分类

    1. 按挖掘的方法分有数据驱动型、查询驱动型和交互型

知识发现已经出现了许多知识发现技术,分类方法也有很多种,按被挖掘对象分有基于关系数据库、多媒体数据库;按挖掘的方法分有数据驱动型、查询驱动型和交互型;

  1. 按知识类型分有关联规则、特征挖掘、分类、聚类、总结知识、趋势分析、偏差分析、文本采掘。
  2. 知识发现技术可分为两类:基于算法的方法和基于可视化的方法 。

大多数基于算法

知识发现

的方法是在人工智能、信息检索、数据库、统计学、模糊集和粗糙集理论等领域中发展来的

  1. 关联技术
  1. 基于算法的方法和基于可视化
  2. Web和搜索引擎
  3. 分类
  4. 数据结构化 标注 属性标准化化

Atitit 知识发现 艾提拉总结 目录 1. 知识发现 1 1.1. 与数据挖掘的区别与联系 数据挖掘的一种更广义的说法 2 1.2. 基本任务 3 1.2.1. 数据分类 3 1.2.2.相关推荐

  1. Atitit mis 管理信息系统概论 艾提拉著 目录 1. 互联网三大定律 2 1.1. 摩尔定律和 2 1.2. 吉尔德定律 电脑及网络宽带资源成为重要免费资源 2 1.3. 梅特卡夫定律 用户

    Atitit mis 管理信息系统概论 艾提拉著 目录 1. 互联网三大定律 2 1.1. 摩尔定律和 2 1.2. 吉尔德定律 电脑及网络宽带资源成为重要免费资源 2 1.3. 梅特卡夫定律 用户越 ...

  2. Atitit 关于艾提拉个人简绍 中文日文英文对照版

    Atitit 关于艾提拉个人简绍 日文版 经历了很多项目实践,具备较为宽广的IT从业与信息化工作背景,具备若干创业历程,道路曲折,初心不改.在相关领域累计了较深的深度(细化度)与高度(抽象度)与广度 ...

  3. 艾提拉近年来技术大总结

    ##基本信息 姓名:艾提拉    民族:汉  生日:1984.3 email:1466519819@qq.com 英文名&网名id : attilax 曾用名:艾龙 ##主要方向与目标: 技术 ...

  4. 大话数据结构读书笔记艾提拉总结 查找算法 和排序算法比较好 第1章数据结构绪论 1 第2章算法 17 第3章线性表 41 第4章栈与队列 87 第5章串 123 第6章树 149 第7章图 21

    大话数据结构读书笔记艾提拉总结 查找算法 和排序算法比较好 第1章数据结构绪论 1 第2章算法 17 第3章线性表 41 第4章栈与队列 87 第5章串 123 第6章树 149 第7章图 211 第 ...

  5. Atitit ffmpeg功能表 多媒体处理类库工具 音频视频 1.1.ffmpeg音视频合成  1.2.Atitit 视频音频分离 提取法 1.3.ffmpeg对视频封装和分离 使用ffmpeg对

    Atitit ffmpeg功能表 多媒体处理类库工具 音频视频 目录 1.1. ffmpeg音视频合成 1 1.2. Atitit 视频音频分离 提取法 1 1.3. ffmpeg对视频封装和分离 1 ...

  6. 麦肯锡意识-艾森·拉塞尔、保罗·弗里嘉

    麦肯锡意识 作者:艾森·拉塞尔.保罗·弗里嘉 艾森·拉塞尔,曾担任麦肯锡公司咨询顾问,服务过的客户包括金融.电信.计算机和消费品等领域的众多知名公司. 麦肯锡意识 - 怎样从思维方式上,真正成为一个团 ...

  7. controller层没反应_热拉提一年做几次?热提拉的副作用根本没在怕的~

    热拉提一年做几次?热提拉的副作用根本没在怕的~传说在一片神秘的土地,有一汪神奇的泉水,名曰:青春不老泉.任何人只需一品,即保持青春不老.然而,传说毕竟只是传说--继热玛吉.超声刀之后,全球新一代逆龄神 ...

  8. 匈奴国王阿提拉:令整个欧洲发抖的上帝之鞭

    匈奴国王阿提拉:令整个欧洲发抖的"上帝之鞭" 文章来源: 网易历史 阿提拉(Attila,406-453)登基成为匈奴帝国的王之后.公元433年,27岁的阿提拉与他的兄弟布来达(B ...

  9. 提拉开关分水器冷热水龙头配件,提拔拉杆,提拉杆胶圈更换

    家里浴室水龙头漏水,因为提拉杆上的胶圈断裂了,如下图: 这种提拉切换分水的水龙头漏水的话,去五金店是买不到配件的,他们会让你换掉整个水龙头. 能想到的办法比如:502胶,记得粘上要用力压一段时间:用玻 ...

  10. 阿提拉公司 java_Atitit  文件上传  架构设计 实现机制 解决方案  实践java php c#.net js javascript  c++ python...

    Atitit 文件上传 架构设计 实现机制 解决方案 实践 java php c#.net js javascript c++ python 1 . 上传的几点要求 2 1 .1. 本地预览 2 1 ...

最新文章

  1. 存在于实数域的微观粒子4-能量可以转变为物质
  2. Spring-AOP @AspectJ进阶之访问连接点信息
  3. 中国唯一入选 Forrester 领导者象限,阿里云 Serverless 全球领先
  4. Python进阶_wxpy学习:常见问题
  5. Windows下有关信息收集的命令
  6. HomeBrew 更换为国内源--提高brew命令操作速度
  7. Mysql学习总结(31)——MySql使用建议,尽量避免这些问题
  8. flutter持久化_开源项目【WanAndroid_Flutter】玩安卓 Flutter 版
  9. codemirror TAB 缩进问题记录
  10. 图片旋转_系统自带画图程序,图片旋转翻转调整大小修改转换格式图文教程
  11. 根据pid查端口_PID控制原理:看完这几个故事你就明白了
  12. 三星安卓手机刷linux,三星galaxy nexus刷ubutun系统的详细步骤
  13. 播放RTMP协议的流媒体的两种选择
  14. 【笔记】autoCAD无法显示文字解决方案
  15. 我是如何从电脑小白走上编程之路
  16. 操作系统磁盘调度算法相关习题
  17. Android 自定义图片点击放大、缩小
  18. 防火墙区域及工作模式
  19. 【JavaWeb】JSP技术详解
  20. 基于Python3(Autosub)以及Ffmpeg配合GoogleTranslation(谷歌翻译)为你的影片实现双语版字幕(逐字稿)

热门文章

  1. 去除标题_1688如何通过黄金标题引爆流量?
  2. Everything+ listary+TotalCommander+QTTabBar相互整合
  3. 一文了解数据库索引:哈希、B-Tree 与 LSM
  4. 四十三、配置防盗链、访问控制Directory、访问控制FilesMatch
  5. 自管理图形处理结构框架
  6. 基于日志处理的ElasticSearch的学(gen)习(feng)
  7. mac 删除文件夹里所有的.svn文件
  8. 多式样ProgressBar(转)
  9. 唐努乌梁海问题的由来
  10. DataGrid 绑定定制的列