基于关系数据库的top-k聚合关键词查询

张东站,  苏志锋,  林子雨+,  薛永生

(厦门大学计算机科学系  福建厦门  361005)

(ziyulin@xmu.edu.cn)

Top-k Aggregation Keyword Search over Relational Databases

Zhang Dongzhan,  Su Zhifeng,  Lin Ziyu,  Xue Yongsheng

(Department of Computer Science, Xiamen University, Xiamen, Fujian 361005)

Abstract Keyword search over relational databases allows users to search databases without any knowledge of database schema and query languages. Given a keyword query, the existing approaches find individual tuples which match a set of query keywords based on primary-foreign-key relationships in databases. However, it is more useful for users to get the aggregation result of tuples in many real applications, and those existing methods cannot be used to deal with such issue. Therefore, this paper is focused on the problem of top-k aggregation keyword search over relational databases. Here recursion-based full search algorithm, i.e., RFS, is proposed to get all aggregation cells. To achieve high performance, new ranking techniques, keyword-tuple-based two dimensional index and quick search algorithm, i.e., OQS, are developed for effectively identifying top-k aggregation cells. A large number of experiments have been implemented upon two large real datasets, and the experimental results show the benefits of our approach.

Key wordsaggregation keyword search; relational databases; two dimensional index; aggregation cell; ranking

摘要  基于关系数据库的关键词查询,使得用户在不需要掌握结构化查询语言和数据库模式的情况下,可以方便的进行关系数据库查询.给定一个关键词查询,已有的方法通过数据库中的主外键关联,查询得到包含关键词的元组集合.但是,在很多实际应用中,元组集合的聚合结果对用户更有价值;研究了基于关系数据库的top-k聚合关键词查询,提出了基于递归的聚合单元枚举算法—RFS.为了获得更好的查询性能, 设计了新的排序方法、二维索引和快速搜索算法—OQS,从而可以高效地枚举top-k个聚合单元;在不同的数据集上进行了大量的实验,实验结果表明OQS算法具有良好的查询性能.

关键词 聚合关键词查询;关系数据库;二维索引;聚合单元;排序

【注:论文已经录用,等待发表,论文PDF请等待《计算机研究与发展》官网发布】

计算机数据库方向论文ei,数据库实验室1篇论文被《计算机研究与发展》EI期刊录用...相关推荐

  1. 计算机研究与发展 介绍,我院NLP团队研究成果论文被《计算机研究与发展》期刊录用...

    2020年6月15日,华南师范大学软件学院"自然语言处理与智能软件技术"研究团队(简称:NLP团队),在团队负责人曾碧卿教授带领下,在EI期刊<计算机研究与发展>上,录 ...

  2. 论文会议推荐到计算机研究与发展,计算机研究与发展类论文参考文献 计算机研究与发展核心期刊参考文献有哪些...

    [100个]计算机研究与发展类论文参考文献,每一个论文参考文献都是精选出来的,看了后定能知晓计算机研究与发展核心期刊参考文献有哪些等相关写作技巧,让计算机研究与发展论文写作轻松起来! 一.计算机研究与 ...

  3. 小米AI实验室4篇论文入选语音技术顶会INTERSPEECH 2022

    滴滴--重磅消息新鲜出炉!!  全球语音领域顶级会议 INTERSPEECH 2022公布了论文入选名单,小米 AI 实验室4篇论文被接收.INTERSPEECH 是由国际语音通信协会ISCA组织的语 ...

  4. ECCV 2020 语义分割论文大盘点(38篇论文)

    作者:CV Daily | 编辑:Amusi Date:2020-09-25 来源:计算机视觉Daily微信公众号(系投稿) 原文:ECCV 2020 语义分割论文大盘点(38篇论文) 前言 距离EC ...

  5. 最新!CVPR 2021 医学图像分割论文大盘点(5篇论文)

    点击下方卡片,关注"CVer"公众号 AI/CV重磅干货,第一时间送达 作者:Amusi  |  来源:CVer 前言 昨天分享了MICCAI 2021上Transformer+医 ...

  6. ECCV 2020 实例分割+全景分割论文大盘点(14篇论文)

    前言 计算机视觉Daily 正式系列整理 ECCV 2020的大盘点工作,本文为第三篇:实例分割和全景分割方向. 前两篇详见: ECCV 2020 目标检测论文大盘点(49篇论文) ECCV 2020 ...

  7. 史上最全AI论文集结:近千篇论文分门别类整理好

    搞AI,在不断精进自己代码的同时,更应该提升自己的阅读能力.需要不断地阅读大量的最新.最前沿的论文,也要深扎经典论文根基.因为阅读论文可以帮助你深入原理,理解AI更前沿的发展状态,掌握更前沿的技术热点 ...

  8. 现有论文和作者两个实体,论文实体的属性包括题目、期刊名称、年份、期刊号;作者实体的属性包括姓名、单位、地址;一篇论文可以有多个作者,且每一位作者写过多篇论文,在每一篇论文中有作者的顺序号。请完成以下操

    题目要求   现有论文和作者两个实体,论文实体的属性包括题目.期刊名称.年份.期刊号:作者实体的属性包括姓名.单位.地址:一篇论文可以有多个作者,且每一位作者写过多篇论文,在每一篇论文中有作者的顺序号 ...

  9. 电子学报、计算机研究与发展中文期刊投稿过程记录

    电子学报.计算机研究与发展中文期刊投稿过程记录 电子学报: 一月二十投稿,至十一月十五录用排版.历时十个多月. 总体来说电子学报很规范 很严,历经两次外审,审稿意见很犀利. 计算机研究与发展: 总历时 ...

最新文章

  1. 关联规则挖掘算法_#数据挖掘初体验 使用weka做关联规则
  2. eclipse未能识别我的手机
  3. LINUX内核分析第四周——扒开系统调用的三层皮
  4. matlab/simulink常见问题汇总
  5. 交叉路口红绿灯控制程序linux,PLC十字路口的交通灯控制编程实例!
  6. 参数注入:最简方法,直接注入
  7. 思维风暴 codeforces (1060A) Phone Numbers
  8. Spring MVC 4快速入门Maven原型得到了改进–更多Java 8功能
  9. oracle数据库dblink创建语句_「运维实验」——达梦数据库DBlink连接Oracle配置
  10. 虚拟语气和推测(三)
  11. 设计模式之单例模式-C++
  12. python中如何表示_新行在Python中是如何表示的?
  13. Linux进阶之环境变量文件/etc/profile、/etc/bashrc、/etc/environment
  14. 学生选课管理系统(毕业设计)
  15. 《普林斯顿微积分读本》学习笔记
  16. vue-router路由文档详解
  17. python 获取 汉字 %开头的 gb2312 编码
  18. NShape(开源矢量图形编辑器) 入门(二)
  19. java中import是什么意思_java中import关键字是什么意思
  20. awk 的内置变量 NF、NR、FNR、FS、OFS、RS、ORS

热门文章

  1. 点要素生成面要素(Arcgis实操系列)
  2. LaTex的安装(Windows)2022船新版本
  3. POCO软件测试工程师,Poco: 跨平台的UI自动化测试框架,适用于游戏和App
  4. 数据库中的三种完整性:域、实体、参照完整性
  5. IT公司都不喜欢招培训班出来的学生,那培训班的意义何在呢?
  6. C#限制TextBox文本框输入格式
  7. 9个非常漂亮的国外网页设计
  8. VMware Workstation 不可恢复错误: (vcpu-1) Exception 0xc0000005 (access viola
  9. nvm最全面的下载安装教程
  10. php有什么版本,php哪个版本稳定?