6月15日,备受瞩目的第27届ACM SIGMOD国际数据管理学术会议在美国休斯顿落下帷幕,在SIGMOD 2018现场,阿里巴巴举办了主题为“数据驱动及机器学习赋能的自治数据库系统”的Workshop,四支技术团队联袂为100余位国际同仁展示了“阿里数据平台”的能力。

本次专题研讨会由集团数据库事业部高级研究员飞刀主持,内容分为两部分,第一部分由阿里集团和阿里云的瑞萍,鸣嵩,德迈、历下分别介绍了阿里巴巴AnalyticDB/Data Lake Analytics, PolarDB, X-DB Engine,计算平台(包括MaxCompute,PAI,Blink和MaxGraph)等产品,如何依靠创新来解决阿里巴巴业务场景中传统数据库及数据处理技术难以克服的挑战。

(阿里巴巴WORKSHOP立牌)

第二部分是邀请五位学术界知名教授作为panel discussion嘉宾,各自分享了他们在“AI+数据库”领域的工作以及对这个领域的一些看法,这五位教授分别是:

Gustavo Alonso, Professor and ACM/IEEE Fellow, ETH Zurich

AdityaParameswaran, Assistant Professor, University of Illinois Urbana-Champaign

IhabIlyas, Professor and ACM SIGMOD Vice Chair, University of Waterloo

Tim Kraska, Associate Professor, Massachusetts Institute of Technology

Andy Pavlo, Assistant Professor, Carnegie Mellon University

(飞刀、靖人与五位教授合影)

Gustavo Alonso教授在其分享中特别提出Autonomy through Hardware的观点,认为自治数据库需要是模块化的,且需要应用新硬件技术来更精细化地监控和优化整个系统,例如使用FPGA技术来监控机器学习,做安全检查,并提控系统控制等。他还分享了基于这些技术所构建的原型系统。

AdityaParameswaran教授则风趣地以改编肯尼迪总统讲话来做开篇:“Ask not what ML can do for you, but what you can do for ML.”他指出其实机器学习的处理流程是一个“很痛苦”的迭代过程,这个过程需要人工参与其中。这中间每次迭代计算的时间消耗都很大,可以通过caching和reuse部分之前的中间结果来缩减这部分消耗。同时还需要更好的技术来帮助这个流程中的用户来理解和调整每次迭代计算。最后,他指出在AI Winter is coming之际,学术界应该考虑如何应对。

IhabIlyas教授分享了在Data Cleaning and Integration领域应用机器学习的洞见和成果。他特别指出,数据科学家在对数据做机器学习计算前,需要花费大量的时间精力来对数据做预处理,包括transformation, ETL, joining, changing formats等等。其中涉及到data curation的问题则是更具挑战的难题,而在这些领域应用了机器学习反过来可以对机器学习的处理流程带来巨大帮助。

TimKraska教授则提出了System for Machine Learning的观点。如何建立一个完整的系统环境来帮助数据科学家更高效地分析处理数据是他的一个主要研究方向,包括借鉴数据库的查询优化器来帮助机器学习的任务找到最优的处理pipeline。另一方面,他也提出要把机器学习更深入地推到数据库系统中来,包括之前广受关注的其Learned Index工作在内,也将是他认为的一个主要研究方向。

Andy Pavlo教授携去年提出的自动驾驶数据库(Self-driving Database)研究成果,在本场研讨会上更近一步阐述和明确了其Self-driving Database的涵义。不同于传统的Auto Admin只是提供半自动化建议,真正的自治数据库一定是一个“预测-计划-实施-观测-反馈再预测”的完整闭环系统。其中action实施的工程化将是重要一环。

在回答与会者的提问中,几位教授还特别指出,数据库和机器学习领域可以相互帮助,如数据库可以帮助机器学习专家来完成复杂的线性代数运算,部署Machine Learning pipeline等。但同时不要试图去强制改变现有的机器学习pipeline,而是可以在机器学习处理流程的优化和调优上提供帮助。数据库领域的专家学者们可以借鉴大数据生态的演进发展,逐步把数据库技术带入机器学习中而不是强求打造一个“全能的”数据库。最后几位教授也对阿里巴巴在此领域的继续贡献充满期盼。

此次的Workshop是集团几个数据库团队和计算平台第一次携手共同发出声音,不仅全面展现了阿里巴巴数据平台能力,而且通过与学术专家的深入交流,能够让阿里巴巴更全面的看清数据库领域未来发展方向,提前进行技术储备及布局。

最后,附上几张现场照片,让更多同学感受下现场氛围。

(阿里巴巴SIGMOD展台)

(阿里巴巴WORKSHOP提示屏)

(飞刀向教授们赠送阿里公仔)

(阿里巴巴专题研讨会现场)

(阿里巴巴技术同学合影)

SIGMOD回顾:数据库国际大咖组团来阿里,他们都说了啥?相关推荐

  1. 天桥脑科学研究院推出“对话大脑”院士论坛:国际大咖畅谈脑机接口

    天桥脑科学研究院推出"对话大脑"院士论坛 追问探索科学的边界 国际大咖畅谈脑机接口 方兴未艾的脑机接口有什么最新成就?马斯克的有创植入,还是无创读心术会成为主流?<骇客帝国& ...

  2. 一图速览 | DTCC 2021大会,阿里云数据库技术大咖都聊了些什么?

    简介:3天9场干货分享,快来收藏吧! 10月18日~10月20日, 由国内知名IT技术社区主办的数据库技术交流盛会--DTCC 2021 (第十一届中国数据库技术大会)在京圆满落幕.大会以" ...

  3. 【直播回顾】技术大咖带你学前端:走近前端设计模式

    本周白月光为我们带来了前端福音,4月8日晚上直播串讲了前端开发的相关知识,为了方便错过直播的小伙伴学习,本次直播是可以回放观看的~ [直播回放]前端技术变革(一):前端设计模式演变 https://l ...

  4. 【直播回顾】技术大咖揭秘网络通信中的数据安全

    特殊的2020年,多个行业线下转线上求生,未来属于云时代似乎成为互联网的共识,而与互联网息息相关的网络安全领域,已经站上澎湃发展的"风口".今天技术大咖--白月光给大家讲解网络通信 ...

  5. 重量级大咖来袭:阿里云生命科学与智能计算峰会精彩内容剧透

    8 月 5 日,阿里云生命科学与智能计算峰会将于北京望京昆泰酒店举行.本次峰会将汇集生命健康领域及高性能计算领域的众多专家发表主题演讲.碰撞思想火花,共同探索生命科学和高性能计算的结合,为医药创新的发 ...

  6. 重磅 | 20+技术大咖齐聚 阿里云数据库创新上云峰会进入一周倒计时

    简介:余票不多,免费抢票!9月26日,"数聚云端·智驭未来"--阿里云数据库创新上云峰会暨第3届数据库性能挑战赛决赛颁奖典礼,将在北京隆重召开.

  7. 大咖论赛——阿里云天池TOP选手不得不说的那些事儿

      我是阿里云天池比赛的冠军,我和几个大佬一起分享了一些入门比赛和提高比赛成绩的方法, 可点击回放链接学习 ,或者复制https://live.csdn.net/room/broadview2006/ ...

  8. 大咖说 * 对话开源|论数据库人才发展战略

    校企机构等多方角色如何参与数据库开源生态建设?如何通过校企合作培养更多数据库人才?本期大咖说,阿里云联合武汉大学.深圳大学和上海开源协会展开共同探讨. 嘉宾简介 阿里云数据库产品事业部首席架构师.阿里 ...

  9. 大咖说*对话开源|企业如何用好开源数据库

    本期大咖说,阿里云数据库开源战役负责人惊玄携手吉利汽车集团DBA负责人胡志诚,与你分享关于企业如何用好开源数据库的一些思考与实践经验. 嘉宾介绍 惊玄:阿里云数据库开源战役负责人 胡志诚:吉利汽车集团 ...

最新文章

  1. 这些Java8官方挖的坑,你踩过几个?
  2. Apache POI和EasyExcel 第一集:小叙
  3. C++知识点6——数组与指针初步
  4. 3 文件读写 计时 我的烂电脑在1S钟能写70多MB的数据
  5. 史上最全阿里云服务器上Docker部署Springboot项目 实战 每一步都带详细图解!!!
  6. Linux下Poppler源码编译安装
  7. set built-in function
  8. SIMPLE/REUSE/BATCH 三种执行器的区别?
  9. GT-----FAQ整理
  10. python3语音识别模块_零基础教你玩转语音控制,学习语音控制技术,打造智能生活很简单...
  11. 【技术干货+限时活动】openstack原理及在华为云中的应用
  12. 利用大数据构建智能交通
  13. php mysql 备份还原_php 数据库备份还原
  14. java检测安卓程序退出_java – 退出应用程序时的Android停止服务
  15. spring-cloud-sleuth 和 分布式链路跟踪系统
  16. WebUI自动化测试框架搭建从0到1(完整源码)更新完毕
  17. python如何连接sql_python连接SQL数据库
  18. LGP993使用心得和Android手机使用建议
  19. PaaS平台的应用趋势是什么?
  20. java p2p开发项目实战(完整)

热门文章

  1. 几行代码,网盘链接提头来见!
  2. Python 3 开发钉钉群机器人
  3. kali 2020 ssh自启动_自动化所于2020年“国科大杯”创新创业大赛获得多项奖项
  4. python类加载器_利用Python反序列化运行加载器实现免杀
  5. android读取assets中的html文件,android读取assets文件.htm
  6. camunda 流程执行追踪_九思OA项目管理解决方案:规范企业项目流程,掌握项目进展...
  7. spring-security问题记录
  8. springboot中的mybatis是如果使用pagehelper的
  9. spring security 学习二
  10. C#排队处理DEMO