2015 中国大数据技术大会已经圆满落幕,本届大会历时三天,以更加国际化的视野,从政策法规、技术实践和产业应用等角度深入探讨大数据落地后的挑战,作为大数据产业界、科技界与政府部门密切合作的重要平台,吸引了数千名大数据技术爱好者到场参会。

本届大会邀请了近百余位国内外顶尖的大数据技术专家,以及来自各知名机构的一线开发人员,为与会者提供了13场精彩纷呈的特邀报告和近百场全覆盖的专题报告。报告内容涉及Hadoop、YARN、Spark、THBase、Kudu、PostgreSQL-X2等开源软件的最新进展,以及内存计算、大数据下的可视化、机器学习/深度学习、商业智能、数据分析等的最新应用案例。 众多重量级嘉宾奉献了一场场干货十足的主题分享,没有到场参会的同学,你们有福了,本文将奉上本届大会的第一手干货。

1. 启明星辰公司副总裁潘柱廷:2016 年大数据技术发展趋势解读  PPT下载

启明星辰公司副总裁,CCF 大数据专家委员会副秘书长潘柱廷发表了最新的“2016 年大数据技术发展趋势”,其主要包括:可视化推动大数据平民化;多学科融合与数据科学的兴起;大数据安全与隐私令人忧虑;新热点融入大数据多样化处理模式;随后,通过2013-2015的趋势对比指出了我国2016年大数据发展的最主要推动者将来自于大型互联网公司、政府机构和创业企业。

2. Databricks公司联合创始人、Spark首席架构师辛湜:Spark发展:回顾2015,展望2016  PPT下载

辛湜带来主题为《Spark发展 :回顾2015,展望2016》的演讲,他介绍了Spark的目标是“Unified engine across data workloads and platforms”。在谈到Spark在2015年最大的改变时,他感觉应该是增加了DataFrames API。对于Spark的生态圈,他表示主要侧重三个不同的方向,一个是上层的应用,二是下层的环境,还有最重要的是连接到的数据源。

3. 京东云平台总架构师、系统技术部负责人刘海锋 :从2014 到2016,大规模内存数据库演进之路 PPT下载

刘海锋带来了名为“大规模内存数据库JIMDB:从2014到2016”的主题演讲。JIMDB基于redis,以内存为中心的数据存储,其底层技术研发包括了存储引擎(Dict、LSM with RAM-SSD hybrid、B+Tree)、复制协议(async、sync等)、分片策略(Hash、Range)三个部分。过去两年,JIMDB一直持续建设,拥有着数千台大内存机器,多个数据中心,1000+线上集群,支撑了京东几乎所有的业务。

4. Hulu 资深研发主管梁宇明 :Voidbox - Docker On YARN在Hulu的实践 PPT下载

Docker 技术越来越得到了很多开发者的青睐,而YARN对于多数爱好者来说还是一个比较新的产品平台。如果两者放在一起融化会发生什么事情呢?来自Hulu公司的资深研发主管梁宇明为大家讲解了这一神奇的经历。他的演讲题目是《Voidbox - Docker On YARN在Hulu的实践》。因为基于YARN的大数据计算平台使得不同的计算框架可以在同一集群中混合部署,进而提升了集群资源利用率。

5. Pivotal 研发总监姚延栋:开源大数据引擎:分布式Greenplum数据库内核分析 PPT下载

姚延栋介绍到GPDB源数据库是为大数据存储、计算、挖掘而设计的。接下来,他详细介绍了Greenplum 架构,该产品支持标准SQL支持,SQL 2003 OLAP扩展、支持 MapReduce、扩展编程语言(Python,R, Java, Perl, C/C++);并为客户提供访问接口,通过第三方工具实现文本分析和数据挖掘等。

6. 阿里巴巴iDST语音组高级专家鄢志杰 :Deep Learning助力客服小二:数据技术及机器学习在客服中心的应用  PPT下载

鄢志杰发介绍数据技术及机器学习/深度学习在客服中心的应用,主要包括三个方面:一、语音识别沉淀客服数据,GPU多机多卡训练声学模型来识别语音;二、自动语音识别支撑传统客服全量质检,通过问题定位质检提升客服一致性;三、支付宝“我的客服”自动问题识别,通过用户行为轨迹进行预测。

7. 小米金融技术主管方流: 大数据在互联网金融中的应用  PPT下载

方流在主题演讲中重点介绍了DW建设的业务架构及开发工具,包括log利器Scribe、ETL利器之Hadoop/Hdfs、DW利器之HBase、数据分析利器Hive/Sentry、OLAP利器Impala、数据迁移利器之sqoop、机器学习利器之spark。同时重点分析了用户金融画像并针对大数据反欺诈,给出了自己的探索实践,防止盗号,提供异常环境监测/手机验证;防止身份伪造,采用实名认证;鉴定虚假资料,进行交叉验证。

8. 新加坡管理大学信息系统学院教授朱飞达 :大数据与金融创新:从研究到实战  PPT下载

新加坡管理大学信息系统学院教授朱飞达分享了基于社交媒体大数据的个人征信应用模式,包括四个方面:提取社交维度特征,加入现在传统信用模型;采用产生式模式挖掘不同信用类别的隐含用户模型;基于社会关系网络的风险传递查询和探索引擎;实时反欺诈侦测和预警系统。

9. 宜信大数据创新中心首席数据科学家项亮: 大数据在信用风险管理中的应用  PPT下载

项亮带来的演讲主题是“大数据在信用风险管理中的应用”,现在金融行业获取的数据来自用户的方方面面,之前在传统金融中如何利用这 些数据一直没有得到系统的研究。项亮的演讲主要聚焦宜信数据系统是如何 设计的,数据来源是什么,如何存储和整理数据,如何提供服务。

10. 南京大学计算机系PASA大数据实验室教授黄宜华 :Octopus(大章鱼):基于R语言的跨平台大数据机器学习与数据分析系统  PPT下载

黄宜华认为大数据+机器学习是驱动全球互联网企业的核心。大数据机器学习是一个同时涉及到机器学习和大数据处理两个主要方面的交叉性研究课题。面向大数据复杂分析挖掘,现有的串行化机器学习与数据挖掘算法都需要重写,进行并行化设计以及不同的大数据并行处理平台上,各种大数据机器学习与数据挖掘算法需要进行基于特定平台的并行化算法设计等问题的存在,迫切需要研究提供一种统一化并易于使用的大数据机器学习系统支撑平台。

11. 百度基础架构部高级架构师沈国龙 :BML百度大规模机器学习云平台实践 PPT下载

沈国龙提他总结了机器学习成功的要素:一、数据。包括数据收集和多套数据的打通,清晰、明确、“洁净”的数据源、Online & Offline数据的结合;二、系统。快速、低成本的实现,支持规模快速扩张的高效算法库,AB Test和模型迭代机制;三、评价标准。覆盖率、置信度、差异性、采纳率、新颖性、隐私性、预测Auc、NDCG、收入波动、人工使用体验等指标,对整体系统的影响。

12. 新浪微博算法技术总监姜贵彬:大数据驱动下的微博社会化推荐  PPT下载

新浪微博算法技术总监姜贵彬发表题为《大数据驱动下的微博社会化推荐》的演讲。他主要从以下几个方面进行了分享:推荐的角色与定位、大数据与推荐的关系、数据驱动下的微博推荐、商业推荐。他认为推荐扮演了加速器和调控器的角色。加速器是指加速优质信息传播、加速高价值关系构建、加速用户成长。调控器是指优化用户关系网络结构、调控和引爆信息的定向传播。

13. FreeWheel技术副总裁李旸:FreeWheel基于大数据的新兴视频广告测量实践  PPT下载

他主要从以下三个方面进行了分享:新兴视频广告测量方式、用户性别年龄预测、广告完成率预测。他提到广告测量的挑战仍然是广告的实际效果很难被测量,视频广告缺乏有效的测量方式。目前大多数都采用基于用户反馈进行测量。新兴视频广告测量方式包括三种:数字收视率、广告完成、可见曝光。

14. 阿里巴巴数据安全部阿里数据安全小组总监郑斌:大数据下的数据安全  PPT下载

阿里巴巴数据安全部阿里数据安全小组总监郑斌在《大数据下的数据安全》主题演讲中表示以数据流控制为中心的IT时代正走向以数据共享为基础、激活生产力为目的的DT时代,而大数据是新的生产要素,互联网+的新基础设施云网端(云:云计算、大数据;网:互联网、物联网;端:终端,APP)正激活大数据。

15. 数美公司联合创始人兼CTO梁堃:Sentry金融实时风控系统  PPT下载

数美公司联合创始人兼CTO梁堃在主题演讲中介绍了Sentry金融实时风控系统。他表示实时风控系统对于银行业继续保持高速发展越来越重要。Sentry金融实时风控系统是基于大数据技术构建的实时交易风险评估系统。其工作过程是,在每一笔交易发生时,实时进行(1)业务系统将交易信息发送风控系统;(2)发现该交易中存在的异常行为和可疑场景;(3)根据发现的“证据”计算该交易的风险系数;(4)将风险系数等相关信息反馈给业务系统。

欢迎关注 @CSDN云计算微博,了解更多云信息。

2015 中国大数据技术大会 PPT 尝鲜相关推荐

  1. 2015中国大数据技术大会在北京隆重开幕

    2015中国大数据技术大会在北京隆重开幕 2015年12月10日,作为大数据领域规模最大.最具影响力的IT盛会,2015中国大数据技术大会(BDTC 2015)在北京新云南皇冠假日酒店盛大开幕.CCF ...

  2. 2016中国大数据技术大会六折抢票最后一周(附部分讲师名单)

    2016年12月8日-10日,由中国计算机学会(CCF)主办,CCF大数据专家委员会承办,中国科学院计算技术研究所和CSDN共同协办的2016中国大数据技术大会(Big Data Technology ...

  3. 倒计时1天 | 2019 中国大数据技术大会(BDTC)报名通道即将关闭(附参会提醒)...

    2019年12月5-7日,由中国计算机学会主办,CCF 大数据专家委员会承办,CSDN.中科天玑数据科技股份有限公司协办的中国大数据技术大会(BDTC 2019)将于北京长城饭店隆重举行.届时,超过百 ...

  4. 5折票倒计时3天 | 超干货议程首度曝光!2019 中国大数据技术大会邀您共赴

    (大会官网https://t.csdnimg.cn/U1wA) 2019年,大数据与人工智能的热度已经蔓延到了各个领域,智能交通.AIoT.智慧城市,智慧物流.AI中台.工业制造等各种黑科技成为热搜名 ...

  5. 倒计时 1 天 | 2019 中国大数据技术大会(BDTC)报名通道即将关闭(附参会提醒)...

    2019年12月5-7日,由中国计算机学会主办,CCF 大数据专家委员会承办,CSDN.中科天玑数据科技股份有限公司协办的中国大数据技术大会(BDTC 2019)将于北京长城饭店隆重举行.届时,超过百 ...

  6. CSDN VIP年卡大放送!中国大数据技术大会超值福利,等你来拿!

    (剧透:文末有彩蛋~) 2019年,大数据与人工智能的热度已经蔓延到了各个领域,智能交通.AIoT.智慧城市,智慧物流.AI中台.工业制造等各种黑科技成为热搜名词.而在今年的乌镇互联网大会上,大佬们聊 ...

  7. 一场高质量的技术盛会怎样炼成?「2019中国大数据技术大会」蓄势待发,还不快上车?...

    2019年12月,一场轰动国内产业界.学术界.科研界及投资领域的顶级科技盛会即将拉开帷幕,它涵盖大数据.人工智能.云计算.AIoT.金融科技.智能制造等十几个前沿领域的热门话题.在过去十二年里,这场盛 ...

  8. 「2019中国大数据技术大会」超值学生票来啦!

    大会官网:https://t.csdnimg.cn/U1wA 经过11年的沉淀与发展,中国大数据技术大会见证了大数据技术生态在中国的建立.发展和成熟,已经成为国内大数据行业极具影响力的盛会,也是大数据 ...

  9. 顶尖技术专家严选,15场前沿论坛思辨,2019中国大数据技术大会邀您共赴

    扫码了解2019中国大数据技术大会(https://t.csdnimg.cn/IaHb)更多详情. 2019中国大数据技术大会(BDTC 2019)将于12月5日-7日在北京长城饭店举办,本届大会将聚 ...

最新文章

  1. 关于虚拟空间与物理空间思想的解析
  2. C#实现微信AES-128-CBC加密数据的解密
  3. 页面置换算法简单对比----《operating system concepts》《操作系统原理》
  4. Android --- RecycleView 中默认选择第一个 item,点击第 2 个 item 时改变其字体样式,其余的 item 的字体样式恢复默认
  5. 求高光谱图像相关系数矩阵
  6. 错误 Every derived table must have its own alias
  7. python屏幕的交互(读取输出信息)input,raw_input的区别
  8. python统计词频_python统计词频
  9. kaggle案例实战
  10. [我的理解]Javascript的原型与原型链
  11. (整理)REHL6.5_Yum安装Reids
  12. 总有被遗忘或者没有及时跟进的工作
  13. VirtualBox 中的Centos如何安装VBoxGuestAdditions
  14. RN对接京东支付sdk(IOS)
  15. 阿里巴巴P3C java编程规范(最新版github下载)
  16. android模拟器电视,AndroidTV 模拟器的搭建
  17. 【读书笔记】《全域营销:付费增长与流量变现实战讲义》——我的公域私域运营教科书
  18. 677_AUTOSAR_TR_Methodology_文档阅读4
  19. win10降win7_软硬兼施Win7:8核笔记本/移动工作站出坑记
  20. ORA-04021导致oracle11gADG备库宕机问题处理

热门文章

  1. 计算机gh,你值得拥有的GH小技巧(二)—数据结构专篇
  2. 氢键有机/有序框架材料,简称HOF
  3. DirectDraw 基础篇
  4. 【原创】深度学习第5弹:以其人之道还治其人之身
  5. autojs ui模式下画方框
  6. 一名合格的数据分析师,自己的职业生涯应该如何规划?
  7. centos安装rocketmq
  8. hive sql 时间戳转换与时间的各种转换
  9. python爬虫——全书网
  10. php实现stripos,PHP stripos