亚马逊最近发布了一项新AWS服务,把大数据流带入到了类似SaaS的世界里,你向输入流执行一个SQL查询就可以获得输出数据了,不必再花时间写代码或者搭建底层基础设施。

\\

对于那些在存储和计算方面非常看重工程上的快速部署和无限扩展的公司,云就是他们的最终归宿。基于Hadoop提供大数据PaaS已经发布很久了,Azure提供的是HDInsight,AWS提供的是Amazon Elastic MapReduce,但现在更加重磅的实时流处理的产品终于出场了。在Azure云上做事件流处理主要用的是一种非常简单、类似SaaS的方法,现在AWS终于也提供了类似产品。

\\

Amazon Kinesis Analytics现在已经发布了,是微软在2015年发布的Azure Stream Analytics的直接竞争产品。两种服务都是用相同方法实现流分析功能的:挂接到数据源,再指定目的端,然后不断地运行查询命令来生成输出结果。分析就是通过查询命令做的,两个产品都用SQL(或非常类似SQL的语言),这就非常容易实现具体的分析了。

\\

在云这个行业有个非常有趣的趋势:平台提供商都在努力把自身的经验和优势应用到云上分析中,努力通过抽象让最终用户非常容易使用自己的产品。现在的AWS Kinesis产品就是亚马逊用来为AWS用户们提供细粒度指标的。在项目启动时担任数据服务部总经理的Ryan Waite说:“这让我们测量服务的处理能力上了新台阶,可以实时发出预警了”。它成功地将重心从“你可以在我们这里做这件事”转变成了“我们可以帮你作这件事”。AWS首席宣传官Jeff Barr在他的宣传Amazon Kinesis Analytics的博客中主要强调了容易使用这个方面:

\\

\

你可以关注处理数据并从中提取业务价值,再也不必浪费时间部署基础设施了。不超过5分钟,只需要写一点点复杂度绝对不超过SQL查询的东西,你就可以构建起一套强大、端到端的流处理管道了。

\

\\

Kinesis Analytics使用的是管道模型,分析程序连上数据源,不断地运行某个查询命令,再把结果输出到某个目标端。源可以是Kinesis Stream或者Kinesis Firehose,这样你就可以把数据从很多个事件生产者那里汇集起来,交给某个查询。SQL查询可以简单到查看有多少生产者在发送数据的SELECT DISTINCT操作,也可以复杂到做类似滑动窗口的分析。目标端也可以是Kinesis Stream或Firehose,这样你就可以把累积数据存入一个关系型数据库,或者把原始数据存入Hadoop。

\\

要达到与IaaS甚至PaaS相同的效果,就需要有类似Kafka的分布式输入队列,有类似Apache Storm或Spark Streaming的流处理引擎,以及像Elasticsearch一样的分布式目标端。这些都是需要大量管理工作的分布式集群,而分析则是你要自己写代码、测试和部署的定制化解决方案部分。Kinesis Analytics内部是SQLStream,所以AWS是在用ANSI标准SQL提供一个可管理的流分析解决方案。

\\

Azure也是类似的,与AWS对应的流分析服务最近发布了一个PowerBI(微软的数据可视化工具)的输出连接器。Azure Stream Analytics研发部经理Ryan CrawCour把这种端到端的分析解决方案与用户自己定制的方案作了一个对比:

\\

\

在以前如果你想构建一套系统,对自己的数据按自身需求进行分析并且将结果展示出来,首先要做数据清洗,再保存到某个数据库中,然后再自己写好程序去不断地查询分析数据,最终再展示到自己写的展示界面上。

\

\\

不管数据中心还是云,现在在大数据开发领域最受关注的就是实时分析和事件流了。今年Spark 2.0的发布为流式数据源增加了DataFrame支持。Apache NiFi(一个支持流的大数据处理和路由工具)已经发布了1.0版。Hortonworks也发布了新版本DataFlow 1.2,这个是基于NiFi并专注于流处理的。

\\

在大数据处理领域Lambda架构一直都是通用做法:把所有数据都做持久化存储用于批量处理,再把关键数据抽取出来做实时可视化展示。与批处理相比,实时处理一直都缺乏比较好的通用的管理手段。有了Kinesis Analytics之后,大家在寻找基于云的解决方案时就有了新选择。

\\

查看英文原文:Amazon Kinesis Analytics is Like SaaS for Big Data Analysis

象SaaS一样用亚马逊Kinesis Analytics做大数据分析相关推荐

  1. 亚马逊大卖Anker做“街电”:国外低头族热捧,国内与海底捞合作-雨果网

    亚马逊大卖Anker做"街电":国外低头族热捧,国内与海底捞合作-雨果网 亚马逊大卖Anker做"街电":国外低头族热捧,国内与海底捞合作-雨果网 posted ...

  2. 亚马逊测评如何做?亚马逊测评的获得方法?

    我想大多数卖家应该都是知道亚马逊测评能够快速帮助自己的产品添加评论,获取排名,打造爆款.但是有很多卖家都不清楚亚马逊如何做?获得方法有哪些?那么下面就一起来了解一下! 4102.png 亚马逊测评如何 ...

  3. 产品上架后,亚马逊运营应该做什么

    当一个亚马逊产品上架后,运营成熟以后,每天运营应该做些什么呢?下面海熹跨境人才网就来给大家说说亚马逊运营每天的工作,一起来了解一下吧. 1. 分析后台数据 数据的分析工作一般我会放在上午进行,这个时候 ...

  4. 亚马逊欧洲站现在做怎么样?

    亚马逊欧洲站好做吗?随着亚马逊美国站竞争的不断加剧,越来越多的卖家开始关注起了亚马逊欧洲站,当然在亚马逊欧洲站上vat的问题下也有不少卖家退缩的,不过作为亚马逊上流量表现不错的欧洲站,到底它好做吗?下 ...

  5. 亚马逊刷评风险大,卖家该如何正确留评?

    评论对于Listing出单和转化率非常重要,但是不要轻易踩刷评论的红线.一直以来,亚马逊都明确禁止违规操作评论的行为,管控力度日益加大.如果稍不注意可能就会受到严厉的惩罚.卖家要遵守亚马逊政策的红线, ...

  6. 跨境电商亚马逊想转做独立站?要知道独立站怎么运营

    跨境电商亚马逊想转做独立站?要知道独立站怎么运营 2020年独立站如何运营,来看看大卖家的构想 围绕独立站运营的话题有产品选择.落地页.转化率.复购率等. 一.选品 选择产品的方向往往是非主流.新奇等 ...

  7. 亚马逊云科技构建Serverless数据分析战略

    亚马逊云科技Amazon EMR是行业领先的大数据分析服务,适用于使用开源框架进行PB级数据处理.交互分析和机器学习,它可以更快地运行大数据应用并且成本不到本地解决方案成本的一半.通过性能优化且兼容开 ...

  8. 因一个 Bug,谷歌、GitHub、亚马逊等网站全球大范围宕机!

    整理 | 郑丽媛 出品 | CSDN(ID:CSDNnews) 打开一个网站,无法访问:换一个网站,又无法访问. 遇到这种情况的你,会认为是什么问题:断网了?可有些社交软件能正常使用:浏览器出 Bug ...

  9. 做独立站要做私域营销,做亚马逊更要做私域营销,Why?

    来自海关总署的公布数据: 今年上半年中国货物贸易进出口总值达到18.07万亿元,比去年同期增长27.1%.其中,出口9.85万亿元,增长28.1%:与2019年同期相比,出口增长了23.8%. 蛋糕这 ...

最新文章

  1. oracle数据库 gbk,oracle 数据库编码转换(转GBK) | 学步园
  2. AngularJS自定义表单验证
  3. 小米笔记本写代码真香,包邮送一台!
  4. python widnows mysql_python用Windows开发配置mysql数据库
  5. 表单的管理作业及答案
  6. _tkinter.TclError: no display name and no $DISPLAY environment variable
  7. 金融科技:科技生活化和生活金融化
  8. 图及算法----并查集父亲查找写法比较 DisjointSet
  9. 阶段3 2.Spring_08.面向切面编程 AOP_4 spring基于XML的AOP-配置步骤
  10. java递归算法经典实例_java简单编程题问第五个人多少岁?java递归算法经典实例...
  11. 中国电信5G技术承载网络
  12. 名人养生贴网络疯转 跟李嘉诚们学做长寿优等生
  13. home brew php71安装,php,_mac home-brew 安装 php 失败,php - phpStudy
  14. #pragma clang diagnostic
  15. 怎样删除pdf中的多页?pdf如何选择其中几页?pdf文档可以删除某一页
  16. NUIST2022级第一周集训
  17. 大数据之hive:hive分桶表
  18. 从南丁格尔图到医学发展史
  19. 京信通信成功打造自动化工厂(MES应用案例)
  20. 我的游戏制作人面面谈(不是原出处)

热门文章

  1. GIS投影的基本原理、超图数据集导入导出坐标系文件
  2. 图解Oracle 12c创建数据挖掘(Data Miner)用户dmuser
  3. Android Studio:missing feature Watch
  4. Angular.js 最强学习资源合集
  5. 初探Git git基本用法
  6. BNUOJ-26474 Bread Sorting 逆序对
  7. 创建WCF第一个应用程序
  8. JS中获得窗口属性的方法
  9. 2*2矩阵训练集比例对BP神经网络分类性能影响
  10. html的关于上一行对齐,html – 如何在一行上对齐我的所有li?