基于图数据库的空间频繁并置模式挖掘
摘要
空间频繁并置模式(SPCP)是一组空间特征的子集,它们的实例在地理空间中频繁地出现在一起。基于内存物化实例邻近关系并搜索模式实例效率较高,但实例信息会被重复存储。图数据库技术能高效地对具有复杂关联关系的数据建模,但基于实例邻近关系图移植已有的挖掘方法不能发挥图遍历的优势。针对上述问题,探索了基于图数据库的空间频繁并置模式挖掘方法。首先,利用图数据库对空间实例及其邻近关系建模,即将实例和关系存储在图数据库中。然后,基于图数据库设计了一个称为子图(团)搜索的基本算法,采用团查找的方式生成模式的表实例从而获得参与实例,避免了传统方法中效率较低的组合或连接操作。考虑到通过生成表实例收集参与实例的效率较低,设计了参与实例验证算法,包括过滤阶段和验证阶段。过滤阶段判断一个中心实例的邻居集中所涉及的特征是否完全包含了待计算模式中的特征,验证阶段则是判断是否存在一个模式实例包含该中心实例。参与实例验证算法每次验证一个中心实例都尽可能多地去确定参与对象,从而有效地减小了搜索空间和减少了团的搜索次数。此外,对提出算法的正确性和完备性进行了证明。最后,在真实和合成数据集上做了大量的实验,验证了所提算法的效率和有效性。
关键词: 空间数据挖掘; 图数据库; 空间并置模式; 子图搜索
当前人们正处在一个大数据时代,随着科学技术的不断进步以及各种电子设备的研发,人们所面对的数据呈现爆炸式的增长趋势。这些数据不仅包括类别标签信息
基于图数据库的空间频繁并置模式挖掘相关推荐
- 基于图数据库、图算法、图神经网络的 ID Resolution/ID Mapping 大数据分析方法与代码示例
本文首发于 NebulaGraph 公众号 "本文是一个基于 NebulaGraph 上的图数据库.图算法.图神经网络的 ID Resolution/ID Mapping 方法综述,除了基本 ...
- 基于图数据库的新型肺炎传染图谱建模与分析
原文地址:https://mp.weixin.qq.com/s/9BYk1ONd3gKTzBW0WnxuJw 一.背景与数据来源介绍 新型肺炎作为一种存在潜伏期的传染病,分析其传染关系及接触关系非常有 ...
- 【技术分享】李文哲:基于图数据库的大数据应用
本文整理自DTCC2016主题演讲内容,录音整理及文字编辑IT168@田晓旭@老鱼.如需转载,请先联系本公众号获取授权! 演讲嘉宾 李文哲 普惠金融首席数据科学家 普惠金融(puhuifinance. ...
- 基于图数据库的菜品推荐系统
基于图数据库的菜品推荐系统 基于图数据库的菜品推荐系统 一.菜品主材提取 二.数据结构 三.系统架构 Here's the table of contents: 基于图数据库的菜品推荐系统 本文来自社 ...
- 知识图谱-基于图数据库的知识表示常用结构以及Nebula Graph的实现
目录 一.知识图谱的表示方式 1.1 特定领域的知识图谱 特点 1.2 简单的通用知识图谱 特点 补充 1.3 可自定义本体的通用知识图谱 特点 补充 二.图数据库选型 三.基于Nebula Grap ...
- 基于图数据库的物联网模型(1)-图数据库与模型设计
物联网的图模型 所谓"物联网"是指规模巨大的设备,传感器将实现联网,通过这些联网设备来收集数据,存储和分析,并且和人员,应用软件产生的数据相互关联,实现处理复杂的事件的最优化.基于 ...
- c++图的创建_使用 Amazon Neptune 构建基于图数据库的应用
在社交网络.推荐引擎和欺诈检测等应用场景中,您需要在数据之间创建关系并快速查询这些关系,此时,图数据库将比关系数据库更具优势.因为使用关系数据库构建这些类型的应用程序面临着许多挑战.您将需要创建多个具 ...
- 图数据库在CMDB领域的应用
[导语]在上期的图数据库介绍中,我们对什么是图数据库,以及图数据库所擅长的领域做了一个初步的介绍,也收到了众多的反馈和咨询,特别要求我们对图数据库在一些具体行业的应用能做一些深入介绍.为此,从本期文档 ...
- 企业如何通过图数据库及知识图谱形成业务壁垒
随着业务数据量级猛增.业务数据类型愈加多样化.业务复杂程度的激增,传统的关系型数据库早已无法反映企业业务情况的全貌,对于分析对象之间的关系洞察也显露出了能力瓶颈.在这样的大背景下,企业对图数据库的需求 ...
最新文章
- substr vs substring
- 2019 快过去了,自动驾驶发展得怎么样了?
- 接口转发和重定向区别(二)
- lintcode: 爬楼梯
- ruquireJS入门
- GIT学习笔记二(本地项目发布到GIT)
- 学生信息管理系统中遇到的问题解析
- oracle 经纬度算距离,根据经纬度诀别用java和Oracle存储过程计算两点距离
- 中国电影史上最大泄漏事故?国家版权局出手了...
- docker 安装与常用命令与常用容器(containers)环境
- spring-cloud-oauth2
- 华为云k8s环境部署应用
- 中小网站运营推广思路
- 特征多项式的基无关性
- 理论计算机科学奖项,厉害了!背景提升神奖——丘成桐计算机科学奖助你入藤校...
- 使用免费OA系统,让你成为职场锦鲤
- 他其实没那么喜欢你 豆瓣影评
- 2020年电气试验考试题库及电气试验答案解析
- 透射电镜测试样品的制备要求和方法
- pd.factorize ( ) 解析
热门文章
- Mac下移动硬盘的分区以及TimeMachine的备份
- 程序员真的都不爱炫富吗?
- 基于51单片机的废气检测I2Cproteus仿真
- 腾讯地图android,手机腾讯地图
- SpringMVC —— @ResponseBody原理
- 如何利用(微软学术)/(google学术)/google网页,聚焦最新科技文献,并获得PDF版...
- 网络通过猫传输到计算机,网络直接从光猫出来好还是接个路由器再接入电脑好?看完搞懂了...
- python如何计算复利_复利到底怎么计算?
- mysql类似于excel的删除重复项_删除重复数据 excel去除重复数据 怎么筛选重复数据 excel重复数据合并...
- 【多目标优化】1. 多目标优化的相关基本概念