文章讲的是全民大数据时代已来 阿里数加平台详解,业界流行一种说法,云计算与大数据就是一枚硬币的两面,相生相惜,不可分割。在当下互联网时代,数据的价值越来越受到社会的认可,并在今天,已然成为一种普惠资源,像水、电、能源一样支持社会发展。今天,2016年的阿里云栖大会首站在上海拉开帷幕,作为本场大会的重磅新闻,阿里云全球首发了可以提供一站式大数据处理能力的平台——“数加”,并全新亮相了20款新产品,通过阿里云开放出来,让“普惠大数据”成为可能。

  

  DT时代 如何让数据从成本中心走向价值中心

  据IDC出版的数字世界研究报告显示,2013年人类产生、复制和消费的数据量达到4.4ZB。而到2020年,数据量将增长10倍,达到44ZB。大数据已经成为当下人类最宝贵的财富。但全球真正享受大数据红利的公司不足千分之一,人类已挖掘的数据财富更是不到百万分之一。

  如何打破传统3个月删除存储空间以节约成本的固有规则,让数据真正通过计算产生价值?

  随着大数据的蓬勃发展,数据计算性能的提升,使得数据从成本中心走向价值中心成为可能,而阿里此次发布的“数加平台”就恰恰是将这种能力赋予普通企业甚至个人的途径之一。作为数加平台的发布嘉宾,阿里云大数据事业部资深总监徐长亮介绍,经过7年的双11洗礼,原来的阿里大数据产品ODPS今天正式更名为“数加大数据平台”并通过阿里云向外界开放,提供普惠大数据服务。“我们已经预先走过了很多坑,相信可以为更多企业与个人提供高效、稳定的数据计算服务。是大数据计算变成普惠能力,将更有助于帮助大家发现数据背后的价值,我们在金融领域的试用仅是开始,未来所有的声音都将是围绕数据展开。”

  

  

  毫无疑问,借助大数据技术,阿里巴巴取得了巨大的商业成功。通过对电子商务平台上的客户行为进行分析,诞生了蚂蚁小贷、花呗、借呗;菜鸟网络通过电子面单、物流云、菜鸟天地等数据产品,为快递行业的升级提供技术方法。 在这些创新中,“数加”承载了阿里巴巴EB级别的数据加工计算,经历了上万名工程师的实战检验。据介绍,大麦网是阿里云“数加”平台的首批尝鲜者。通过采用“数加”的推荐引擎,大麦网的研发成本从900人天降低到了30人天,效率提升了30倍。

  另外,在输出自身大数据能力的同时,徐长亮介绍“数加”还向有数据开发能力的团队开放。这些团队可入驻“数加”,借助数加上的工具为各行各业提供数据服务。“这就像在淘宝开店一样,只是他们售卖的是专业能力。”徐常亮表示,阿里云计划用3年时间吸引1000家合作伙伴入驻,共同分享1万亿的大数据蛋糕。

  20款全新产品为“数加平台”增效赋能

  在过去的5年里,全球大数据计算性能实现了超过20倍的增长,100TB数据排序时间由8274秒缩短到377秒。“很显然,束缚大数据的技术瓶颈已经被完全打破,数据将从企业的成本中心转变为价值中心,2016年我们将迎来大数据应用的全面落地。”徐常亮说,通过数加平台,我们希望所有企业都能像阿里巴巴一样更高效的使用大数据。

  此次,“数加”平台首批集中发布了20款产品,覆盖数据采集、计算引擎、数据加工、数据分析、机器学习、数据应用等数据生产全链条。“这些技术至少领先业界三年”,徐常亮说。

  大数据计算服务(MaxCompute)、分析型数据库(Analytic DB)、流计算(StreamCompute)共同组成了底层强大的计算引擎,速度更快,成本更低。经测算,自建Hadoop集群的成本是数加的1.5倍,国外计算厂商AWS 的EMR成本更是数加的5倍。

  

  

  

  具体说来包括:

  1、大数据计算服务可6小时处理100PB数据,相当于1亿部高清电影。单集群规模过万台,并支持多集群联合计算。做到了速度更快,成本更低。

  经测算,自建Hadoop集群的成本是数加的1.5倍,国外计算厂商AWS 的EMR成本更是数加的5倍。阿里云当天还宣布,大数据计算服务再降价50%。

  2、分析型数据库可实现对数据的实时多维分析,百亿量级多维查询只需100毫秒。

  3、流计算擅长对实时流式数据进行分析,具有低延时、高性能的特点。每秒查询率可以达到千万级,日均处理万亿条消息、PB量级的数据。

  计算引擎之上,“数加”提供了最丰富的云端数据开发套件,开发者可一站式完成数据加工。这些产品包含:数据集成、数据开发、调度系统、数据管理、运维视屏、数据质量、任务监控。

  整体来看,大数据开发套件的优势包括:支持100人以上协同设计、开发、运维;具有良好的扩展性;提供各个产品功能模块的Open API,可二次开发;多个数据实例之间的数据授权机制,确保数据只能使用却不可见;提供白屏化的运维能力,以及字段级数据质量监控、机器预警、资源使用率监控等功能,让用户更好的掌控自己的数据及数据任务。

  另外,计算引擎之上,“数加”提供了最丰富的云端数据开发套件,包括数据集成、数据开发、调度系统、数据管理、运维视屏、数据质量、任务监控。

  徐长亮介绍,在数据分析方面,通过移动数据分析(Mobile Analytics)产品,开发者可快速搭建日志采集、分析系统;通过数加BI报表产品,3分钟即可完成海量数据的分析报告;通过数据可视化产品DataV,一星期就能做出双11同款大屏。

  在数据分析方面,数加提供了3款产品供开发者使用:

  1、 通过移动数据分析产品,开发者可快速搭建日志采集、分析系统,从而为用户提供个性化服务;

  2、 通过数加BI报表产品,3分钟即可完成海量数据的分析报告。产品支持多种云数据源,提供近20种可视化效果。

  3、 通过数据可视化产品DataV,一星期就能做出双11同款大屏。这款产品,曾支持了阿里巴巴多年的双11、双12作战指挥。

  

  这一平台承载了阿里云“普惠大数据”的理想,即让全球任何一个企业、个人都能用上大数据。

  同时,基于DataV,数加还发布了面向政府的行业应用产品“郡县图治”。通过这款产品,县长可以在一个屏幕下统览全县各项经济民生数据,为政府决策提供辅助。

  对于时下大热的机器学习,数加更是提供了全面支持。“数加”发布的机器学习工具,可基于海量数据实现对用户行为、行业走势、天气、交通等的预测。图形化编程让用户无需编码、只需用鼠标拖拽标准化组件即可完成开发。产品还集成了阿里巴巴核心算法库,包括特征工程、大规模机器学习、深度学习等。

  为了能够帮助开发者更快捷在应用中集成大数据功能,“数加”同时提供了规则引擎、推荐引擎、文字识别、智能语音交互等数据应用产品。

  行业的健康发展,自律很重要。徐常亮强调,数据是客户的宝贵资产,任何云计算平台都不能移作它用。阿里云将严格遵守去年7月份发起的《数据保护倡议书》,也希望全行业能够自律,共同迎接大数据产业的爆发。

  

作者:张苗苗
来源:IT168
原文链接:全民大数据时代已来 阿里数加平台详解

全民大数据时代已来 阿里数加平台详解相关推荐

  1. 大数据时代的特种兵——阿里数据产品团队

    阿里巴巴集团在 2012 年设立首席数据官岗位(CDO),并成立了数据平台事业部,负责推进数据分享平台战略.在数据平台事业部,有一支十几人的小团队,把自己定义为特种部队,以普及大数据为自己的使命,数据 ...

  2. 大数据时代已来,开发者该如何出击?

    人工智能.大数据.物联网.区块链作为当今信息化发展的新兴技术,离我们的生活越来越近,他们之间也存在着本质的联系,如果将它们看做是我们身体,大数据则是这些触觉到外部信息的存储集合,而数据库则好比人的大脑 ...

  3. 属于 Hadoop 的大数据时代已结束

    作者 | Andrew Brust 译者 | 风车云马 出品 | CSDN(ID:CSDNnews) 以下为译文: 在11天内,13个与大数据相关的 Apache 项目(包括 Sentry.Tajo ...

  4. 大数据技术之Hbase简介以及底层原理详解

    简介 概述 HBase是有Apache提供的基于Hadoop的分布式,可扩展的非关系型数据库 HBase可以管理很大的数据的表 - billions of rows X millions of col ...

  5. 从数据来源、数据生态、数据技术、数加平台等方面,漫谈阿里大数据

    目前人人都在谈大数据,谈DT时代,但是,大数据是什么,每个人都有自己的一个看法,好比盲人摸象,每个都认为自己摸到是真正的大象.我也担心我所看到的,只是大数据的冰山一角,毕竟,将引领整个人类下一次变革的 ...

  6. 数加平台——阿里大数据OS实践

    在云栖计算之旅第5期--大数据与人工智能大会上,阿里云大数据事业部数加平台技术负责人陈廷梁从数加定义.起源.愿景.价值.架构.规划六个方面分享了<数加平台--阿里大数据OS实践>.其中,他 ...

  7. 大数据时代下如何保障信息安全?

    对于"大数据"(Big data),研究机构Gartner给出了这样的定义."大数据"是需要新处理模式才能具有更强的决策力.洞察发现力和流程优化能力来适应海量. ...

  8. 大数据时代与多云时代:一个消亡,一个诞生

    全文共3946字,预计学习时长8分钟 图片来源:unsplash.com/@ev 随着当下的重点从收集数据转向实时处理数据,大数据时代正走向消亡.如今大数据是种商业资产,为即将到来的多云支持.机器学习 ...

  9. 大数据时代,个人如何选择?

    最近拼车,车里一位哥们在侃侃而谈:现在的互联网+,除了打车,其他都是扯淡,没啥用. 我相信现实生活中,这样忽视大数据时代已悄然来临的人不是少数,而且还很多. 毕竟,在中国13亿人口中,从事数据行业的人 ...

最新文章

  1. 包云岗:关于RISC-V成为印度国家指令集的一些看法
  2. 05后都上清华了!首批丘成桐数学领军人才名单发布,三位菲尔兹奖得主为其授课,周末就来学校报到...
  3. Tengine高性能部署之—日志分割
  4. lucene搜索之facet查询原理和facet查询实例——TODO
  5. Python之字符串的134个常用操作
  6. 将本地镜像发布到阿里云
  7. 带超时的system
  8. python选择某一行_Python常用语法有哪些 如何快速入门Python开发
  9. 关于 C++ 中输入输出的猜想
  10. springboot脚本启动bat_SpringBoot修改JVM参数(内置Tomcat命令行启动和IDEA工具配置修改)...
  11. 高斯双边模糊_OpenCV 学习:9 双边滤波bilateralFilter
  12. pymysql安装_centos7.6 安装openstack stein组件之四
  13. springmvc整合fastjson
  14. 2021年中国乙酸异冰片酯市场趋势报告、技术动态创新及2027年市场预测
  15. Codeforces Round #248 (Div. 2) B. Kuriyama Mirai's Stones
  16. 阿里美女面试官问我:Flink资源管理有了解吗
  17. Java从入门到放弃系列
  18. 随机数相关函数rand与srand 以及drand48()与srand48
  19. 短视频剪辑如何入门?给初学者的三个小建议,助你快速入门
  20. 史上最美大型互联网机房综合布线图鉴

热门文章

  1. 不同位数编译器下的基本数据类型所占的字节数(字节大小):
  2. 设计模式:享元模式(Flyweight Pattern)
  3. java:不同数据类型的转换规则
  4. C十三:strcmp函数,比价字符串
  5. 数据泄漏保护:你的企业的投资是否足够?
  6. HDU 4831 Scenic Popularity 暴力模拟
  7. 打造轻量化的View Controller
  8. 升级 Impala(翻译)
  9. 【xinfanqie】五方面快速解决Win8蓝屏问题
  10. ModuleNotFoundError: No module named 'win32api'