前言:由CSDN主办的SDCC 2017之大数据技术实战线上峰会将在CSDN学院举行。作为SD系列技术峰会的一部分,本次线上峰会秉承干货实料(案例)的内容原则,将邀请圈内顶尖的布道师、技术专家和技术引领者,共话大数据平台构建、优化提升大数据平台的各项性能、Spark部署实践、企业流平台实践、以及实现应用大数据支持业务创新发展等核心话题,旨在通过来自国内一线互联网公司实践案例,为开发者提供一个最有价值的高效的技术交流平台!

主题:SDCC 2017之大数据技术实战线上峰会

时间:10月14日 09:00 - 17:15

日前,大数据技术实战线上峰会也公布了首批的讲师和议题,接下来请看:

董西成 hulu

hulu大数据架构部门负责人董西成

个人介绍: hulu大数据部门负责人,资深Hadoop技术实践者和研究者,拥有超过8年的大数据平台平台研发经验;《Hadoop技术内幕》系列丛书作者。

演讲主题: 《Impala+AtScale:构建企业级OLAP引擎》

主题介绍:大数据时代因数据的多样化和处理的复杂化,构建企业级OLAP引擎面临诸多技术挑战。尽管当前开源界提供了多种OLAP解决方案,但灵活性和性能方面均不能令人满意。本次分享将介绍一种基于Impala和AtScale构建企业级OLAP引擎的方案,并进一步介绍了对Impala进行的源码内核级优化。

听众收益:

  • 大数据OLAP引擎的主流方案及优劣对比;

  • Impala+AtScale应用经验及优化;

  • Impala源码级优化。

许鹏 携程

携程机票高级研发经理许鹏

个人介绍:携程机票大数据基础平台Leader,负责平台的构建和运维。深度掌握各种大数据开源产品,如Spark、Presto及Elasticsearch。著有《Spark源码剖析》一书。

演讲主题:《携程机票大数据基础平台架构演进》

主题介绍:携程机票具有丰富的产品线,拥有海量数据,如何存储、分析和应用这些数据一直是部门痛点所在。携程机票大数据团队结合部门业务实际,广泛尝试各种大数据开源产品,在不断摸索中逐步形成稳定的大数据技术栈,该方案支持海量产线数据落地,亚秒级的实时分析和高效快速的交互式查询,更在此基础上结合业务提出了数据产品服务。

听众收益:

  • 大数据解决方案;

  • 开源产品的选型和运维;

  • 大数据团队的技术能力需求和人员组建;

  • 大数据团队和业务部门的结合。

张璐波 Intel

Intel大数据部门高级软件工程师张璐波

个人介绍:目前就职于英特尔大数据部门,高级软件工程师,上海交通大学硕士。之前主要进行网络协议栈的研发工作,现专注于大数据平台架构、Spark Streaming和SQL。

演讲主题:《端到端、可扩展且高容错性的Structured Streaming流式处理技术进阶》

主题介绍: Spark Structured Streaming 流式处理模块作为Spark Streaming的改进版本,在Spark 2.0中引入并解决了以往流式处理在实际应用中遇到的一些问题,在实时数据处理方面发挥了重要作用。Structured Streaming是建立在Spark SQL引擎之上的端到端、可扩展且高容错性的流式处理系统,你可以像进行批处理那样进行流式表达式计算。

随着数据的不断到来,Spark SQL引擎会持续增量的进行计算并更新结果集。本次分享中,主要介绍Structured Streaming的一些基本概念和工作原理。

听众收益:了解Structured Streaming编程模型以及如何处理实时流中乱序以及延迟到达的数据,并对模块高可用性进行细致的分析。

符鹏飞 永洪科技

永洪科技咨询部咨询总监符鹏飞

个人介绍:目前主要负责金融、制造行业数据咨询工作,并成功推进光大银行、民生银行、中信银行、美的集团、华为等众多大型项目落地,同时兼任永洪数据科学研究院讲师,为各行业数据分析爱好者提供数据分析、数据应用方面的培训及指导工作。

演讲主题:《数据技术的下一站——数据应用》

主题介绍:数据技术日渐成熟丰富,处理海量数据不再是企业的挑战,但大多企业都不知数据该如何利用才能对业务和管理提升真正带来价值。永洪基于自身的实践和探索,找出了一条解决之道。

听众收益:

  • 业务用户:掌握数据分析技巧,开发百花齐放的数据应用;

  • 管理层:如何通过数据应用驱动业务经营;

  • IT技术:如何搭建大数据应用分析架构,如何体现IT资产?

汪木铃 蚂蜂窝

蚂蜂窝大数据平台负责人汪木铃

个人介绍: 2014年至今负责蚂蜂窝数据采集、对接、数据产品的开发及整个大数据平台的架构设计、技术选型,专注于大数据工具链的定制开发及应用。

演讲主题:《蚂蜂窝大数据平台架构演进》

主题介绍:本次分享主要涉及蚂蜂窝大数据平台的架构设计、离线数据探索、实时数据探索、多维数据分析中Druid引擎引入的背景和带来的价值。

听众收益:

  • 如何做离线数据探索;

  • 如何做实时数据探索;

  • 如何做多维度数据分析。

陈守元 阿里

阿里集团计算平台事业部产品专家陈守元

个人介绍:阿里集团计算平台事业部产品专家,7年大数据工作经验,曾负责异构数据同步工具DataX产品和架构设计、阿里云流计算产品设计。

演讲主题:《阿里集团实时流计算平台Blink在阿里集团的应用实践》

主题介绍:本次分享将从阿里集团的大数据处理现状讲起,引出实时流计算在阿里集团几个典型应用,包括双十一大屏、ABTest、机器学习。阿里为应对超大规模海量数据,在Flink上面做了诸多技术优化,包括Yarn Scheduler Optimization、Incremental Checkpoint、ASynchronize IO。为了进一步实现实时流平台产品化,阿里集团为社区贡献了包括StreamSQL等核心功能。在集团内部,Blink提供了一站式流式SQL开发平台和拖拽式的在线机器学习平台,演讲中也会进行讲解。

主题介绍:

  • 用户了解流计算在阿里集团的应用案例;

  • 用户了解当前阿里集团在Flink上的重点技术/产品投入点;

  • 用户了解阿里集团内部对于流计算的产品化。

王哲涵 京东

京东大数据平台数据架构部架构师王哲涵

个人介绍: 2015年加入京东,期间在大数据平台研发部工作,目前负责京东大数据平台的架构与研发工作。

演讲主题:《Presto的服务治理与架构优化及在京东的实践与应用》

主题介绍: Presto是大数据adhoc查询的利器,京东对于Presto有较大封装及改造, 将其管理、部署、监控及自愈升级自动化,同时在性能上有大胆的创新尝试,对支撑高并发和缓存查询有较深的研究。

听众收益: Presto的服务治理与架构优化。

如何报名?点击【阅读原文】立即报名!(还可以扫码入群哦

群满请到报名页查看

预告:Intel、Hulu、阿里、京东、携程等大数据实战直播相关推荐

  1. 干货 | 携程机票大数据架构最佳实践

    本文转载自 携程技术中心(ctriptech) 公众号,本文PPT请点击下面 阅读原文 获取 作者简介 许鹏,携程机票大数据基础平台Leader,负责平台的构建和运维.深度掌握各种大数据开源产品,如S ...

  2. 大数据应用:双十一,阿里京东该如何利用大数据寻找突破?

    2017年"双11"交易额又创新高,巨额交易背后是各大平台提前数月的摩拳擦掌.这是一次全民的购物狂欢,更是一场暗流涌动的"军备竞赛",从中我们可以一窥整个零售行 ...

  3. 携程回应大数据杀熟并致歉 二次支付无票是系统Bug

    昨天,有网友在微博上爆料称,携程疑似再次出现"大数据杀熟"现象,理由是自己预订机票,显示总价格17548元,因为发现没有选报销凭证,于是退回去,修正一下.然后,再去支付,就告诉没有 ...

  4. Java程序员从京东、阿里、携程面试回来, 已成功拿到京东offer

    阿里巴巴(一面) 阿里找了一个北邮学长的内推,准确来说应该是直推,是他帮我直接录的简历,他本科进的阿里蚂蚁金服,厉害吧?是真的佩服.第一次在官网上填资料,想想马云有多出名,想想蚂蚁金服这样的顶级技术, ...

  5. 美团点评将全面迎战百度、阿里、携程

    2019独角兽企业重金招聘Python工程师标准>>> 但从O2O大战中稍稍抽身的美团点评,面前却已站上各路新的敌人-中国互联网拥有巨大势力的几大巨头. 在2015年的互联网大合并潮 ...

  6. 携程基于大数据分析的实时风控体系

    携程反欺诈体系经过超过10年的发展和积累,在大数据实时并行计算和实时多维关联分析方面已经非常成熟,是整个体系稳定高效运行的基础. 近两年来,我们在大数据和人工智能方向投入研发资源,产出了设备指纹.CD ...

  7. 干货 | JuiceFS 在携程海量冷数据场景下的实践

    作者简介 妙成,携程云原生研发工程师,主要从事Elasticsearch.JuiceFS的研发运维,关注分布式数据库.NoSQL. 小峰, 携程云原生研发工程师,主要专注于数据库容器化领域,对分布式存 ...

  8. 爬取携程景点评论数据【最新方法】,分析AJAX实现页数跳转的爬取方法

    本文仅供技术学习使用,欢迎转载,转载请注明出处 因为朋友参加数学建模,需要景点数据,而我刚好懂一点点,就帮他写爬虫代码.在网上搜索到一些爬虫方法,但在获取景点ID时,发现现在携程的Request Pa ...

  9. Intel研究院院长吴甘沙:大数据的10个技术前沿(1.8万字+61PPT)

    Intel研究院院长吴甘沙:大数据的10个技术前沿(1.8万字+61PPT) 本次讲座是清华大数据产业联合会"技术•前沿"系列讲座的第一讲,主讲人为英特尔(中国)研究院院长吴甘沙. ...

最新文章

  1. 关于mysql archive存储引擎-专门存储审计和日志数据
  2. Visual Studio 生成项目前自动关闭在运行的程序
  3. php远程文件包含攻击,利用SMB共享来绕过php远程文件包含的限制
  4. python汉诺塔问题_Python汉诺塔问题
  5. c语言函数调用排序用插入法,C语言:编写查找和排序函数(二分查找,冒泡排序,选择排序法,插入排序)...
  6. C++安全方向opensssl(三)3.1 什么是单项散列函数
  7. GridBagLayout用法
  8. web 基于jquery和canvas的打飞机小游戏
  9. S32K FTM(FlexTimer module)详解
  10. Ubuntu18.04安装搜狗输入以及五笔输入法
  11. 由零开始学习小程序架构
  12. ip设置与防火墙外网映射
  13. 基于Qt/C++的音频转换程序,pcm互转wav,位数转换
  14. java面试一般提问的问题,详细说明
  15. 音乐、游戏、教育,谁是字节跳动的下一个“抖音”?
  16. php 豆瓣api_想调用豆瓣电影 api,谁开发过整套的 php 开源吗?或者指点下
  17. 防范勒索蠕虫病毒入侵,3分钟教你快速关闭高危端口445!
  18. 职场——领导的话你得品,你不走心,就容易走人
  19. Keras搭建自编码器
  20. 俄罗斯方块java代码_俄罗斯方块源代码

热门文章

  1. centos禁用exec_CentOS停用按下Ctrl-Alt-Del 重启系统的功能
  2. mysql 半同步_mysql 主从同步 与 半同步
  3. 5分钟k线数据 存储_成功率极高的“分时K线战法”:15分钟K线战法+30分钟K线战法...
  4. 谷歌浏览器外贸版_针对谷歌SEO,你有哪些值得推荐的工具、插件、网站、app,或者技巧分享?...
  5. java unreported exception_Java异常处理
  6. 什么人都可以媚俗,但大学校长不能
  7. 你单身,其实是个科学问题……
  8. 十大经典排序算法(下)
  9. 支付宝的架构到底有多牛逼?还没看完我就跪了!
  10. 如何用普通人能理解的语言解释量子纠缠?