SIGMOD数据管理国际会议(Special Interest Group on Management Of Data.)是由美国计算机协会(ACM)数据管理专业委员会(SIGMOD)发起、在数据库领域具有最高学术地位的国际性学术会议,所收录的论文代表了行业内的最高水平。会议的目的是在全球范围内为数据库领域的研究者、开发者以及用户提供一个探索最新学术思想和研究方法、交流开发技巧、工具以及经验的平台,引导和促进数据库学科的发展。

SIGMOD第一届会议于1974年在美国密西根(Michigan)召开,传统上一直都在北美内部举办。自2004年在巴黎举办起,逐步开始走向国际。值得一提的是,第26届ACM SIGMOD国际数据管理学术会议曾在2007年在北京国际会议中心举行,当时的会议受到国家自然科学基金委员会国际合作交流项目资助,由ACM SIGMOD主办、清华大学承办。这是该会议第一次在亚洲举行、也是第二次在北美以外的国家举行。也是在这一年,中国人民大学信息学院李翠平教授作为第一作者发表了中国大陆第一篇SIGMOD论文。

时隔14年,2021 SIGMOD大会再度回归中国,将于6月20-25日在西安举办。SIGMOD顶级学术会议对促进数据库领域学者和开发者开展更深层次的国际交流与合作,进一步提高我国数据库领域的研究水平有重要作用。华为和巨杉数据库作为中国企业,将以最高钻石赞助级别与微软共同赞助本次SIGMOD大会和编程大赛。

同时,SIGMOD大会、SIGACT和SIGART联合,赞助了关于数据库系统理论方面的年度ACM数据库系统原理研讨会(PODS)会议。SIGMOD/PODS两个会议于1991年在美国丹佛(Denver)首次联合召开,这次联合举办会议的尝试取得了巨大成功,鼓舞了整个数据库界理论和系统的结合。之后SIGMOD会议和PODS会议都是同时举行。每年,该小组都会对在数据管理领域做出的贡献颁发多个奖项。其中最重要的是SIGMOD Edgar F. Codd创新奖(以计算机科学家Edgar F. Codd的名字命名)。

1970年,在IBM工作的计算机科学家Edgar F. Codd发表了一篇名为“A Relational Model of Data for Large Shared Data Banks”的论文,该论文中正式提到关系数据模型,可以说就此开启了关系型数据库难以撼动的黄金时代。Edgar F. Codd于1981年获得计算机界最高奖图灵奖,是第一位获得图灵奖的数据库学者。2003年离世后,为了纪念他对于数据库领域做出的卓越贡献,2004年,SIGMOD将大会最高奖的名称改为SIGMOD Edgar F. Codd创新奖。该奖项旨在鼓励“数据库系统和数据库的开发,理解或使用具有持久价值的创新性和高度重要的贡献”。此外,SIGMOD还会颁发“最佳论文奖”,以表彰每次会议上质量最高的论文,并授予“吉姆•格雷论文奖”,表彰在数据管理方面的最佳博士学位论文。

由于数据库是一门侧重工程的实践类科学,因此学术会议SIGMOD也开始逐渐重视学术界和工业界的合作交流。自2018年起,SIGMOD增加了专门的Industry session。因此,近几年的大会流程通常包括:主题演讲(Keynote Talks),学术报告会(research session)和工业报告会(industry session),同时安排了Workshop、教程演示、研讨会和学生研究竞赛等环节。演讲内容涵盖范围非常广泛,除了传统的交易、存储和索引、查询处理和优化,云和分布式数据库,事务处理等,还涉及到前沿的数据湖和数据仓库、图数据、机器学习和分析、空间数据、数据挖掘和可用性分析、隐私安全和区块链等方面的内容。

近年来,Research Session的论文接收率为17-20%左右,Industrial Session的论文接收率在30%左右。据统计,SIGMOD 2020接收的学术论文共144篇,涵盖数据库领域多个领域,其中以第一作者单位为中国高校(清华大学、北京邮电大学、复旦大学和香港科技大学等)发表的文章共有21篇,大陆高校发表的文章为13篇,约占所有接收研究论文的9%。同时,我们注意到,自2015年开始,SIGMOD大会的最佳论文及最高创新奖项得主不乏华人学者和行业领军人物,例如以阿里、腾讯为代表的厂商以及各大高校的专家学者。

整体来看,在Industrial Session中,涉及传统关系数据库的创新成果正逐年减少,大部分研究工作均是多个领域交叉的成果。与此同时,国内数据库厂商在数据库研究中的参与度越来越高,国产数据库及相关技术在国际数据库领域的地位逐年攀升。中国新一代数据库在大规模企业应用中的实践经验,以及在湖仓一体、云化部署数据库方面的技术创新,在数据库行业中备受关注,也代表中国在数据库国际性学术会议中已占据非常重要的席位。

 湖仓一体:备受瞩目的技术发展趋势

在2020年的SIGMOD大会中,有多个场次的主题演讲均涉及数据湖和数据仓库在企业当中的运用,例如,Databricks发表了有关建立有效的数据湖所面临的挑战的keynote, 来自宾夕法尼亚大学的学者介绍了在数据湖中查找相关表以进行交互式数据科学的研究成果。

作为现代分析和数据科学的数据基础结构,数据湖开始在企业应用中普及并迅速增长。云存储与快速灵活的处理相结合,为构建分析应用程序提供了一种廉价且可扩展的解决方案。尽管数据湖使提取和存储大量数据变得容易,但是有效利用这些数据的能力仍然受到限制。这些数据通常缺乏上下文,不能满足应用程序所需的质量,并且用户不容易理解或发现。数据一致性和准确性问题使得很难从数据湖中获取价值,也很难信任基于此数据的分析。

而在数据仓库层面,大会中的研究提到,日常业务运营和来自不同IoT应用程序的传感器等各种来源不断产生大量数据。它们通常被加载到数据仓库系统中以执行复杂的分析。但是,如果查询涉及联接,尤其是在多个大表上的多对多联接,可能会非常昂贵。由于数据仓库的存储格式以结构化为主,并且历经加工清洗,数据形态显得更加范式化、模型化,因此数据的灵活度较低。

资料来源:Databricks官网

学术界逐渐意识到传统的“湖仓分离”模式所存在的局限性,企业在数据运营、价值挖掘、运维等方面,也遇到了显著的挑战。因此,业界提出了湖仓一体(Data Lakehouse)的概念,旨在为企业提供一个统一的、可共享的数据底座,避免传统的数据湖、数据仓库之间的数据移动,将原始数据、加工清洗数据、模型化数据,共同存储于一体化的“湖仓”中,既能面向业务实现高并发、精准化、高性能的历史数据、实时数据的查询服务,又能承载分析报表、批处理、数据挖掘等分析型业务。

湖仓一体方案的出现,能够帮助企业构建起全新的、融合的数据平台,打破了数据湖与数据仓库割裂的体系,在架构上将数据湖的灵活性、数据多样性以及丰富的生态,与数据仓库的企业级数据分析能力进行融合。通过对机器学习和AI算法的支持,实现数据湖+数据仓库的闭环,极大地提升业务的效率。数据湖和数据仓库的能力充分结合,形成互补,同时对接上层多样化的计算生态。毫无疑问,湖仓一体将会更好地服务于企业,帮助企业实现大数据能力的提升,如降低成本、提升运营效率、业务模式探索等。

今年SIGMOD大会钻石赞助商之一巨杉数据库,也基于湖仓一体架构,针对不同的业务需求场景细分出四大产品线。面向联机数据中台、历史数据服务平台、IoT物联网等海量数据需求场景,为企业级客户打造数据平台的最佳底座。作为数据基础设施,巨杉数据库湖仓一体架构的价值在于打通不同业务类型、不同数据类型之间的技术壁垒,实现交易分析一体化、流批一体化、多模数据一体化,最终降低数据流动带来的开发成本及计算存储开销,提升企业的运作的“人效”和“能效”。

相关阅读

再获嘉奖!巨杉数据库斩获2021全球分布式云大会“分布式数据库贡献奖”

巨杉数据库斩获信创产业大会“信息技术应用创新优秀产品”奖项

分布式数据库或成为新增量

数据库领域顶会SIGMOD背后的故事,这篇文章全部告诉你~相关推荐

  1. 什么是云数据库?这篇文章详细告诉你!

    在互联网时代,如何选择一个高性价比的云,也成为很多企业的痛点.一直以来,云数据库所表现的"即开即用.稳定可靠.安全运行.弹性伸缩.轻松实用"等等优势特点,被电商.游戏.视频.IoT ...

  2. 再有人问你数据库缓存一致性的问题,直接把这篇文章发给他

    在之前的一篇文章<为什么会出现数据库和缓存不一致的问题>中,我们介绍过缓存和数据库会出现数据不一致的几种情况. 我们提到过,在数据库和缓存的操作过程中,可能存在"先写数据库,后删 ...

  3. 三篇论文入选国际顶会SIGMOD,厉害了腾讯云数据库

    好消息!6月13日,腾讯云数据库三篇论文再次入选数据库行业顶会SIGMOD,被SIGMOD 2022 Research Full Paper(研究类长文)收录. 本次被收录的研究成果中,新型数据结构设 ...

  4. 云数据库产品及架构设计背后的考量

    摘要:在阿里云数据库技术峰会上,阿里云数据库高级产品专家萧少聪(铁庵)介绍了全体系阿里云数据库产品并对于阿里云数据库产品的实现架构进行了分享,帮助大家了解了阿里云全数据库产品体系能解决哪些实用场景的问 ...

  5. Mac OS X 背后的故事(二)——Linus Torvalds的短视

    文/王越 <Mac OS X背后的故事>系列文章将为大家介绍Mac OS X的发行版本.技术历史.相关人物等内容.本文是系列连载的第二篇,主要的故事来源是Linus Torvalds的自传 ...

  6. 一文读懂|2021年数据库领域精彩回顾

    数据库网红.CMU数据库课程掌舵人 Andy 老师的数据库2021总结,翻译原文以飨诸位. 原文链接:https://ottertune.com/blog/2021-databases-retrosp ...

  7. Mac OS X 背后的故事(四)——政客的跨界

    文/王越 <Mac OS X背后的故事>系列文章将为大家介绍Mac OS X的发行版本.技术历史.相关人物等内容.本文是系列连载的第四篇. 2000年,美国总统大选,由于选票设计问题,时任 ...

  8. 关于Java背后的故事

    学了这么久的Java,我们都知道Java是美国Sun(Stanford University Network)公司在1995年推出的一门计算机高级编程语言 其实在Java的背后还有很多有趣的故事(●ˇ ...

  9. 图像处理经典图片Lena背后的故事

    点击上方"小白学视觉",选择加"星标"或"置顶" 重磅干货,第一时间送达本文转自|新机器视觉 在数字图像处理中,Lena(Lenna)是一张 ...

最新文章

  1. JBPM4常见错误汇总
  2. Angular1.4.6框架简单读取数据库信息并渲染完成news新闻文章列表以及detail详情页功能(小试牛刀)
  3. 实现Runnable接口的好处
  4. oracle查数据存入数组,如何在SQL查询中使用Oracle关联数组
  5. 怎样解决ASP图片上传漏洞的方法
  6. ZK实际应用:MVVM –与ZK客户端API一起使用
  7. linux tcb,在Linux中从潜藏密码迁移至tcb怎么做?
  8. CUDA 10[Linux]最新 百度云下载[免费]
  9. 视频课程:CMOS模拟集成电路设计--已上线
  10. java开源社区 推荐_13 个最火的 Java 开源项目推荐!总有一个适合你!
  11. 映美精IC Imageing Control .net控件调试问题
  12. matlab各向异性高斯核方向导数滤波器,加权组合多尺度各向异性高斯核对象轮廓检测...
  13. 前馈pid系数_前馈PID控制
  14. 九个最佳ICON图标搜索引擎
  15. C# Winform右下角弹窗方式
  16. AUTOCAD——三种修剪方式
  17. anki填空题卡片模板
  18. 在线python编程网页-手把手教你用Python写一个在线网站,这真的很装逼!
  19. War3地图编辑器基础:玩家设置+地图元素的属性设置+地图事件设置
  20. 文本匹配-bimpm

热门文章

  1. 2012杀毒软件排行榜!
  2. 大众易融迎“端午”活动公告
  3. 黑猴子的家:JavaWeb 之 Title icon
  4. 全量备份,差量备份,增量备份的异同
  5. Tripleo之nova-compute 和Ironic的代码深入分析(三)
  6. 如何破解那种加密光盘
  7. Xcode The 'Apple Push Notification' feature is only available to users enrolled in Apple Develo...
  8. android支持gif图片格式,Android 支持Gif动态图 的imagview
  9. c语言strrchr函数,strrchr_字符串 | Strings_C_参考手册_非常教程
  10. 茅台与小米搞饥饿营销?