始于开源,精于实践,

通过代码赋能产业,解锁行业需求,

让技术的落地掷地有声。

12月19日,

大数据+AI Meetup 第三站·北京站顺利收官,

为2020年的开源应用之旅画上了完美的句点。

在本次大数据+AI北京站的现场,来自阿里云、滴滴出行、微博、Databricks、汇量科技、 Zilliz 等名企的9位讲师集结一堂,通过落地实战为到场观众呈现了大数据与AI融合下的行业解决方案新思考;深度解读了达摩院NLP 算法中台、Delta Lake 最新进展、Hive 到 Spark 迁移方案、Fluid数据平台、Milvus 开源向量搜索引擎、MindAlpha 平台、云原生数据湖构建、微博机器学习平台等覆盖多场景、多维度的“大数据+AI”实践案例。讲师们优质的分享内容与生动的案例讲解更是引发了现场观众的积极互动。

本次活动全程回看链接:

https://developer.aliyun.com/live/245788

现场照片:

本期课题介绍

1、《 NLP 在医学领域的应用》

议题简介:

介绍医疗NLP技术的特点、难点以及阿里算法团队的实践经验,以及阿里巴巴医疗NLP算法中台的建设和在智慧医疗项目中应用。

嘉宾简介:

  • 陈漠沙,阿里云达摩院 高级算法专家


2、《 Hive SQL 到 Spark SQL 在滴滴的实践》

议题简介:

滴滴 Hive SQL 到 Spark SQL 背景介绍, 迁移方案, 当前进展和结果

嘉宾简介:

  • 杨建丹,滴滴出行 大数据架构部专家工程师,。

    负责滴滴 Hive 服务, 离线Yarn调度以及 Spark 服务, 在Yarn, HDFS 和 Hive 上有多年实践经验。


3、《深度解析 Delta Lake Trasaction Log》

议题简介:

Trasaction Log是理解Delta Lake的关键,它为大多数关键功能提供支持,如ACID事务性,元数据管理,time travel等等。本次分享我们详细介绍trasaction的概念、原理以及其如何解决多路并发读写问题。

嘉宾简介:

  • 李元健,Databricks 软件工程师。

    曾于2011年加入百度基础架构部,先后参与百度自研流式计算、分布式Tracing及批量计算系统的研发工作,2017年转岗项目经理,负责百度分布式计算平台研发工作。2019年加入 Databricks Spark 团队,参与开源软件及 Databricks 产品研发。


4、《Fluid -  云原生环境下以应用为中心的数据集管理平台》

议题简介:

得益于容器化带来的高效部署、敏捷迭代,以及云计算在资源成本和弹性扩展方面的天然优势,以 Kubernetes 为代表的云原生编排框架吸引着越来越多的 AI 与大数据应用在其上部署和运行。但是在计算存储分离的大背景下,AI和大数据云原生应用的数据访问性能,效率和成本都受到了巨大的挑战,为系统化解决相关问题,Fluid提供了数据应用协同编排、智能感知、联合优化等一系列能力,并且形成一套云原生场景下数据密集型应用的高效支撑平台。本次演讲中,我们将分享开发Fluid的初衷,设计以及现有的功能演示。

嘉宾简介:

  • 车漾,阿里云智能 高级技术专家。

    从事 Kubernetes 和容器相关产品的开发。尤其关注利用云原生技术构建机器学习平台系统,是 GPU 共享调度的主要作者和维护者。


5、《Milvus 在图片检索场景的最佳实践》

议题简介:

-图片搜索的典型应用场景

-Milvus 开源向量搜索引擎简介

-如何使用 Milvus 实现以图搜图

-深度案例介绍

嘉宾简介:

  • 李云梅, Zilliz 数据工程师/Developer Advocate。

    毕业于华中科技大学计算机专业。熟悉视觉和自然语言两个领域的各种经典 AI 模型。自加入 Zilliz 以来,致力于为开源项目 Milvus 探索解决方案,帮助用户将 Milvus 应用在实际场景中。


6、《汇量科技在 Spark 上构建推荐算法 Pipeline 的实践》

议题简介:

在推荐系统中,数据、特征工程和 AI 算法具有同等重要的地位。汇量科技的MindAlpha 平台,探索了深度学习框架与 Spark 深度结合方案,使得数据处理和算法模型训练能够在同一套框架中执行,构建了完整的算法开发流程,提升了算法实验的开发效率。本次分享将将重点介绍整体的架构设计和实现。

嘉宾简介:

  • 陈绪,汇量科技 Mobvista 资深算法架构师。

    负责大数据与机器学习平台以及广告推荐算法 Pipeline 开发。


7、《云原生数据湖构建、管理与分析》

议题简介:

数字化是各行各业的发展趋势,数据成为其中最重要的生产资料。数据源越来越多,数据也呈爆发式增长,如何有效的管理数据,充分挖掘数据价值,同时考虑成本性能等因素,数据湖架构越来越多的被提起,本次分享会介绍数据湖架构遇到的一些问题和挑战,以及阿里云云原生数据湖构建、管理与分析的一些实践

嘉宾简介:

  • 宋军,花名嵩林,阿里云智能 高级技术专家。

在E-MapReduce 团队从事 Spark 内核优化以及数据湖相关工作,对 Spark /Delta Lake /Hudi 等有深入了解


8、《异构集群,统一计算在微博机器学习平台中的应用》

议题简介:

主要介绍跨集群,多计算引擎,湖仓一体,统一 SQL 等技术在微博机器学习平台中的应用

嘉宾简介:

  • 金玉梅,新浪微博高级系统开发工程师,机器学习平台离线计算负责人


9、《人工智能算法与医学影像分析》

嘉宾简介

  • 王宇,花名同构,阿里巴巴达摩院高级算法专家


更多详细内容,请关注Apache Spark公众号

回复“1219”领取本场讲师全套PPT

2020年即将落下帷幕,

但开发者们对于开源技术的热爱与探讨仍将延续。

在助力产业创新的道路上,

他们将步履不停,

以思考的花火点亮技术大规模落地的未来征途。

在今后,

大数据+AI品牌技术沙龙也将邀请行业内更多的开发者,

定期举办更具学习价值的Meetup活动

与技术圈的伙伴共同发掘开源的价值。

更多信息请加入大数据+ai钉钉交流群

BIGDATA+AI 2020北京站回顾相关推荐

  1. 感谢有你 | LiveVideoStackCon 2020 北京站优秀出品人、讲师与志愿者

    LiveVideoStackCon 2020北京站 圆满落下帷幕,大会组委会评选出了优秀出品人.优秀讲师和优秀志愿者,感谢他们为大会付出的专业和热情. 10月31日-11月1日,连续两天技术理论与实践 ...

  2. IoT Analytics:物联网2020年回顾,十大重要进展

    在2021年开始之际,IoT Analytics评估了2020年物联网在全球的主要进展.本文重点介绍了IoT Analytics对物联网进展的观察以及对2020年十大物联网事件回顾.2020年,物联网 ...

  3. LiveVideoStackCon 2020北京站 | 参会指南

    10月31日,LiveVideoStackCon 2020 北京站将在北京丽亭华苑酒店举行,以下是参会关键信息: 时间:10月31日-11月1日(周六.周日) 地点:北京丽亭华苑酒店 签到:签到开放时 ...

  4. 2020年终回顾:时间会回答成长,成长会回答梦想

    前言 2020年是脚踏实地,慢慢成长的一年,由于疫情的缘故,今年社区没有像去年一样举办多场线下活动,不过 .NET CONF CHINA 大会昨天也在苏州顺利召开,回顾这一年,也有不少惊喜与感悟 20 ...

  5. 大会详细日程:O'Reilly AI Conference 北京站

    AI Conference 北京站 O'Reilly AI Conference 将于 6 月 18 -21 日在北京举行,这场 AI 盛会由 O'Reilly 和 Intel AI 联合举办,大会将 ...

  6. Rasa课程、Rasa培训、Rasa面试系列之 Rasa对话式 AI 网络研讨会回顾

    Rasa课程.Rasa培训.Rasa面试系列之 Rasa对话式 AI 网络研讨会回顾 Rasa公司在网络研讨会系列"对话式 AI 的企业成功"中采访了Rasa公司的两位客户,以了解 ...

  7. Rasterino 2.3.0版for AI 2020 (Illustrator裁切图片一键PS修图插件)

    转载自亿品元素 原文链接:http://www.epinv.com/post/8147.html Rasterino v2.3.0 64bit版(支持AI 2020).Rasterino是一款非常实用 ...

  8. 2020年回顾与2021年展望

    时光荏苒,数月如梭,转眼间2020年已经过去.回顾2020年,确实有些不不容易,从年初一直持续到现在仍然不能放松警惕的新冠疫情:由疫情带来的生活上的不便,经济上的停滞不前,还有大规模的企业倒闭,资金链 ...

  9. Adobe Illustrator(Ai) 2020中文版

    Adobe Illustrator(Ai) 2020中文版在功能上更加侧重于图像的勾画.所以这样看来它们之间的侧重点不同.但是相同的是,它们在矢量图的设计行业中,都是非常受用户欢迎的.如果您对于Pho ...

最新文章

  1. vue响应式给数组中的对象添加新属性
  2. 基于三维向量对的乱序堆叠物体的位姿识别
  3. asp.net core系列 53 IdentityServer4 (IS4)介绍
  4. AI端计算产业应用:如何快速训练高精度模型并在设备端加速计算 | 公开课报名...
  5. hadoop和spark搭建记录
  6. Spring框架基础知识
  7. 容器与Pod到底有什么区别和联系?
  8. 最全的常用正则表达式大全分享(转)
  9. BEGINNING SHAREPOINT#174; 2013 DEVELOPMENT 第9章节--client对象模型和REST APIs概览 client对象模型API范围...
  10. DataQ数据对象为空的解决方法
  11. 最短路径和距离及可视化——matlab
  12. 《软件工程》课程改进意见
  13. EasyExcel 冻结固定表头 和搜索
  14. 解决更改文件扩展名,文件类型没有发生变化的问题
  15. 数据结构——栈的详解
  16. 一分钟了解英语表达:性能,能力
  17. BouncyCastle配置
  18. fiddler更新后证书导出和报错的坑(The root certificate could not be located.)
  19. win10系统过期或处于通知模式
  20. maven下手动导入ojdbc6-12.1.0.1-atlassian-hosted.jar

热门文章

  1. mes系统故障_MES系统目前存在哪些问题?
  2. win7系统鼠标指针乱动怎么办?
  3. 合振动的初相位推导_如何确定合振动的初相位
  4. ROS-学习笔记-02-(Ubuntu20.04+Noetic编译pr2和pr2_navigation)
  5. html网页中必填符号图片,收集的web页面html中常用的特殊符号大全
  6. 斐波那契网格采样(在球面上均匀排列许多点)
  7. 腾讯天美测开一面面经
  8. 《梦里花落知多少》的经典语句(怀念)
  9. 魔道祖师 (作者:墨香铜臭)mobi格式下载
  10. 百度被黑了,哈哈!!