挖掘对象、空间、多媒体、文本和Web数据
1.复杂数据对象的挖掘处理
答:这里的对象是指复杂但相对结构化的数据对象,这些数据对象不能简单的用数据关系来表示,大多数拥有这些数据的应用基本上是面向对象的。这个时候,对数据对象的挖掘就是对复杂结构化的数据对象进行处理。挖掘复杂数据对象的任务是建立复杂对象的多维数据仓库,做联机处理分析,针对多维数据仓库做有效、可伸缩的数据挖掘。结构化多维数据挖掘处理遵循通用的挖掘过程,可以采用一般的数据规约方法。
2.空间数据的挖掘处理
答:空间数据的特点是存在大量与空间相关的数据,包含拓扑或者距离信息,对地理、空间方面有帮助。空间数据挖掘是指提取空间数据库中非显式存储的知识、空间联系或其他有趣的模式。空间数据仓库是面向主题的、集成的、时变的、非易失性的空间数据和非空间数据的集合,用于支持空间数据挖掘和与空间数据相关的决策过程。
由于空间数据信息由空间信息和非空间信息两部分组成,,所以针对空间信息要采用专门的空间维度来保存,做空间信息的挖掘;针对非空间信息要在空间维度的基础上进行非空间信息的处理。空间信息的常用数据挖掘方法有空间数据立方体处理方法和空间聚类方法。
3.多媒体数据的挖掘处理
答:多媒体数据信息是多类信息的数据集合,这些信息数据集合的信息类型有视频、图像、图形、声音、文本、文档、超文本数据等。对多媒体数据的数据挖掘就是针对各种信息类型进行数据挖掘,可以是组合信息的索引,也可以是信息内容。多媒体信息的数据挖掘是一种复合型的数据挖掘,可能同时要使用多种数据挖掘的方法,分别处理图像、文本、声音、空间等。
4.文本数据的挖掘处理
答:文本信息是有各种数据文档组成的,与其他类型的数据不同,文本数据的数据挖掘任务重点关心文本的信息检索。一般检索方法分为两类:文档选择问题和文档秩评定问题。文档选择问题看作是对选择相关文档指定约束条件,类似于给定足够的选择项约束集合,然后根据约束集合中的条件对文档进行筛选,非集合内的条件不被接受。文档秩评定方法使用查询,按相关次序评定所有文档的秩,通过秩的评定来响应客户的查询。确定了这两种方法需要解决的主要问题,对文档选择问题来说:数据预处理、规约、设定标签、索引、约束条件集合是要重点考虑的因素;对于文档秩评定问题的来说:约束条件的权值设定、数据的预处理、规约、文档组成部分的信息挖掘等是要重点考察的因素。
5.Web信息的数据挖掘
答:Web信息网络作为现在一个巨大并告诉增长的信息库,是一个数据挖掘的重要场所。由于Web
本身的结构特点和信息内容重点集中于某些结构上,这有助于信息挖掘。但是这种结构是弹性很大的,有时甚至是动态的,在数据挖掘的过程中要考虑这些特点。常规的数据挖掘方法是仿照文本的数据挖掘方法中文档秩评定问题,对Web信息设定一些权重标准,如高引用的页面、时间、内容、搜素条件的词汇复合等,最后返回一组经过秩评定的Web信息页面。
6.数据挖掘的理论基础
答:数据规约、数据压缩、模式发现、概率论、微观经济学观点、归纳数据库等。
7.可以应用数据挖掘的前提条件
答:必须有足够的数据是最基础的前提,不论这些数据是孤立的还是有序一致的。有了数据也不一定要应用数据挖掘,如果要挖掘的信息是基础数据所不具备的信息,这也是枉然。当数据足够多,需要获取的信息可以从数据中获得支持,还要考虑获取数据的成本问题,就是构建数据仓库、数据挖掘、联机数据分析、数据展示所消耗的成本问题。如果这些前提条件都满足,就可以进行数据挖掘。因为整个挖掘过程是需要消耗时间成本的,对响应时间要求没有那么严格,所以数据挖掘最好是采用存量异步处理+增量异步处理结合的方式进行,还要考虑数据挖掘任务的紧急性和重要性排序。
挖掘对象、空间、多媒体、文本和Web数据相关推荐
- 利用查询条件对象,在Asp.net Web API中实现对业务数据的分页查询处理
在Asp.net Web API中,对业务数据的分页查询处理是一个非常常见的接口,我们需要在查询条件对象中,定义好相应业务的查询参数,排序信息,请求记录数和每页大小信息等内容,根据这些查询信息,我们在 ...
- Web数据存储之localStorage和sessionStorage
Web数据存储之localStorage和sessionStorage 学习前端以来,自己了解有localStorage和sessionStorage的相关存储的知识,也有实践过,但是之前只限于能用的 ...
- 在 Web 数据控件中显示二进制数据54
简介 前面的教程中 , 我们介绍了将二进制数据与应用程序的基础数据模型相关联的两种方法 , 并使用FileUpload 控件从浏览器向 Web 服务器的文件系统上载.我们还将了解怎样将上载的二进制数据 ...
- slickgrid 中ajax,slickgrid.js 一种高性能web数据表格组件的探讨
本文将探讨一种高性能web数据表格组件的实现,首先简单介绍slickgrid这个前人开发的组件,接着对该组件的设计和实现思路进行讨论,最后对该组件的思想进行提炼,实现基于原始思想的新组件. slick ...
- 可爱的 Python: 使用 mechanize 和 Beautiful Soup 轻松收集 Web 数据
可爱的 Python: 使用 mechanize 和 Beautiful Soup 轻松收集 Web 数据 使用 Python 工具简化 Web 站点数据的提取和组织 David Mertz, Ph. ...
- 巧用ASP实现Web数据统计、报表和打印 (转)
巧用ASP实现Web数据统计.报表和打印 (转)[@more@] 巧用ASP实现web数据统计.报表和打印XML:namespace prefix = o ns = "urn:schemas ...
- DM数据库管理模式对象空间、表、索引、触发器、视图、序列列、同义词等。
一.管理模式对象的空间 模式对象的空间管理关系到空间的有效使用和数据的合理分布. 1.设置存储参数 对于普通表和索引,DM8提供了以下的存储参数: 初始簇数目INITIAL:指建立表时分配的簇个数,必 ...
- 目前最流行的Web 数据接口 API 设计规范:RESTful
RESTful 是目前最流行的 API 设计规范,用于 Web 数据接口的设计. 它的大原则容易把握,但是细节不容易做对.本文总结 RESTful 的设计细节,介绍如何设计出易于理解和使用的 API. ...
- python与网页交互_可爱的 Python: 使用 mechanize 和 Beautiful Soup 轻松收集 Web 数据
可爱的 Python 使用 mechanize 和 Beautiful Soup 轻松收集 Web 数据 使用 Python 工具简化 Web 站点数据的提取和组织 David Mertz 2010 ...
最新文章
- comsat java_java-com.thoughtworks.xstream.converters.ConversionExce...
- USB port 如何识别不同的Charger类型
- 合并远程仓库到本地_git远程仓库
- 代码模板在哪里_C++的可变参数模板
- as3 java 交互_AS3常用代码(三):AS3与HTML的交互
- 条令考试小程序辅助器_可以自己编题的答题软件,自定义题库考试出题工具,微信答题小程序...
- 常用JavaScript函数 31 - 46(自我总结)
- 【超清视频】SCCM2012精讲系列课程03:SCCM2012的基础环境初始化(一)
- redis如何选择合适的数据结构
- Python基础学习(二)
- python制作个人相册_这样精美的照片墙,其实python也能做
- 哮喘病人小气道上皮细胞 (Asthma) Small airway epithelial cells 培养解决方案
- Dropout与Inverted Dropout细节,在训练与测试阶段的使用
- rpm包与deb包的制作过程
- 动态组件component
- java大量实例化对象如何调优_成都Java性能调优技巧
- oracle修改mem为手动管理,PSV内存修改金手指插件GoHANmem v2.00下载和使用教程
- Hadoop-MapReduce的工作原理
- Hadoop百度百科
- Chrome 浏览器有些网站无法保存密码,手动保存