亚马逊最近发布了一项新AWS服务,把大数据流带入到了类似SaaS的世界里,你向输入流执行一个SQL查询就可以获得输出数据了,不必再花时间写代码或者搭建底层基础设施。

\\

对于那些在存储和计算方面非常看重工程上的快速部署和无限扩展的公司,云就是他们的最终归宿。基于Hadoop提供大数据PaaS已经发布很久了,Azure提供的是HDInsight,AWS提供的是Amazon Elastic MapReduce,但现在更加重磅的实时流处理的产品终于出场了。在Azure云上做事件流处理主要用的是一种非常简单、类似SaaS的方法,现在AWS终于也提供了类似产品。

\\

Amazon Kinesis Analytics现在已经发布了,是微软在2015年发布的Azure Stream Analytics的直接竞争产品。两种服务都是用相同方法实现流分析功能的:挂接到数据源,再指定目的端,然后不断地运行查询命令来生成输出结果。分析就是通过查询命令做的,两个产品都用SQL(或非常类似SQL的语言),这就非常容易实现具体的分析了。

\\

在云这个行业有个非常有趣的趋势:平台提供商都在努力把自身的经验和优势应用到云上分析中,努力通过抽象让最终用户非常容易使用自己的产品。现在的AWS Kinesis产品就是亚马逊用来为AWS用户们提供细粒度指标的。在项目启动时担任数据服务部总经理的Ryan Waite说:“这让我们测量服务的处理能力上了新台阶,可以实时发出预警了”。它成功地将重心从“你可以在我们这里做这件事”转变成了“我们可以帮你作这件事”。AWS首席宣传官Jeff Barr在他的宣传Amazon Kinesis Analytics的博客中主要强调了容易使用这个方面:

\\

\

你可以关注处理数据并从中提取业务价值,再也不必浪费时间部署基础设施了。不超过5分钟,只需要写一点点复杂度绝对不超过SQL查询的东西,你就可以构建起一套强大、端到端的流处理管道了。

\

\\

Kinesis Analytics使用的是管道模型,分析程序连上数据源,不断地运行某个查询命令,再把结果输出到某个目标端。源可以是Kinesis Stream或者Kinesis Firehose,这样你就可以把数据从很多个事件生产者那里汇集起来,交给某个查询。SQL查询可以简单到查看有多少生产者在发送数据的SELECT DISTINCT操作,也可以复杂到做类似滑动窗口的分析。目标端也可以是Kinesis Stream或Firehose,这样你就可以把累积数据存入一个关系型数据库,或者把原始数据存入Hadoop。

\\

要达到与IaaS甚至PaaS相同的效果,就需要有类似Kafka的分布式输入队列,有类似Apache Storm或Spark Streaming的流处理引擎,以及像Elasticsearch一样的分布式目标端。这些都是需要大量管理工作的分布式集群,而分析则是你要自己写代码、测试和部署的定制化解决方案部分。Kinesis Analytics内部是SQLStream,所以AWS是在用ANSI标准SQL提供一个可管理的流分析解决方案。

\\

Azure也是类似的,与AWS对应的流分析服务最近发布了一个PowerBI(微软的数据可视化工具)的输出连接器。Azure Stream Analytics研发部经理Ryan CrawCour把这种端到端的分析解决方案与用户自己定制的方案作了一个对比:

\\

\

在以前如果你想构建一套系统,对自己的数据按自身需求进行分析并且将结果展示出来,首先要做数据清洗,再保存到某个数据库中,然后再自己写好程序去不断地查询分析数据,最终再展示到自己写的展示界面上。

\

\\

不管数据中心还是云,现在在大数据开发领域最受关注的就是实时分析和事件流了。今年Spark 2.0的发布为流式数据源增加了DataFrame支持。Apache NiFi(一个支持流的大数据处理和路由工具)已经发布了1.0版。Hortonworks也发布了新版本DataFlow 1.2,这个是基于NiFi并专注于流处理的。

\\

在大数据处理领域Lambda架构一直都是通用做法:把所有数据都做持久化存储用于批量处理,再把关键数据抽取出来做实时可视化展示。与批处理相比,实时处理一直都缺乏比较好的通用的管理手段。有了Kinesis Analytics之后,大家在寻找基于云的解决方案时就有了新选择。

\\

查看英文原文:Amazon Kinesis Analytics is Like SaaS for Big Data Analysis

象SaaS一样用亚马逊Kinesis Analytics做大数据分析相关推荐

  1. 亚马逊大卖Anker做“街电”:国外低头族热捧,国内与海底捞合作-雨果网

    亚马逊大卖Anker做"街电":国外低头族热捧,国内与海底捞合作-雨果网 亚马逊大卖Anker做"街电":国外低头族热捧,国内与海底捞合作-雨果网 posted ...

  2. 亚马逊测评如何做?亚马逊测评的获得方法?

    我想大多数卖家应该都是知道亚马逊测评能够快速帮助自己的产品添加评论,获取排名,打造爆款.但是有很多卖家都不清楚亚马逊如何做?获得方法有哪些?那么下面就一起来了解一下! 4102.png 亚马逊测评如何 ...

  3. 产品上架后,亚马逊运营应该做什么

    当一个亚马逊产品上架后,运营成熟以后,每天运营应该做些什么呢?下面海熹跨境人才网就来给大家说说亚马逊运营每天的工作,一起来了解一下吧. 1. 分析后台数据 数据的分析工作一般我会放在上午进行,这个时候 ...

  4. 亚马逊欧洲站现在做怎么样?

    亚马逊欧洲站好做吗?随着亚马逊美国站竞争的不断加剧,越来越多的卖家开始关注起了亚马逊欧洲站,当然在亚马逊欧洲站上vat的问题下也有不少卖家退缩的,不过作为亚马逊上流量表现不错的欧洲站,到底它好做吗?下 ...

  5. 亚马逊刷评风险大,卖家该如何正确留评?

    评论对于Listing出单和转化率非常重要,但是不要轻易踩刷评论的红线.一直以来,亚马逊都明确禁止违规操作评论的行为,管控力度日益加大.如果稍不注意可能就会受到严厉的惩罚.卖家要遵守亚马逊政策的红线, ...

  6. 跨境电商亚马逊想转做独立站?要知道独立站怎么运营

    跨境电商亚马逊想转做独立站?要知道独立站怎么运营 2020年独立站如何运营,来看看大卖家的构想 围绕独立站运营的话题有产品选择.落地页.转化率.复购率等. 一.选品 选择产品的方向往往是非主流.新奇等 ...

  7. 亚马逊云科技构建Serverless数据分析战略

    亚马逊云科技Amazon EMR是行业领先的大数据分析服务,适用于使用开源框架进行PB级数据处理.交互分析和机器学习,它可以更快地运行大数据应用并且成本不到本地解决方案成本的一半.通过性能优化且兼容开 ...

  8. 因一个 Bug,谷歌、GitHub、亚马逊等网站全球大范围宕机!

    整理 | 郑丽媛 出品 | CSDN(ID:CSDNnews) 打开一个网站,无法访问:换一个网站,又无法访问. 遇到这种情况的你,会认为是什么问题:断网了?可有些社交软件能正常使用:浏览器出 Bug ...

  9. 做独立站要做私域营销,做亚马逊更要做私域营销,Why?

    来自海关总署的公布数据: 今年上半年中国货物贸易进出口总值达到18.07万亿元,比去年同期增长27.1%.其中,出口9.85万亿元,增长28.1%:与2019年同期相比,出口增长了23.8%. 蛋糕这 ...

最新文章

  1. 无处不在的人工智能,IBM沃森的20个行业应用
  2. 关于comparable与comparator的用法(即自定义集合框架用法 )
  3. hdu1597(二分)
  4. 通过改善架构来提高 ASP.Net 应用程序的性能
  5. “工业互联网平台“将成为工业制造企业的标配
  6. java io大文件_JavaIO流对大文件进行分割与合并
  7. java统计字符串中每个字符出现的次数_统计字符串出现的次数
  8. python:第一个简单爬虫程序
  9. 元素(HYSBZ-2460)
  10. VS2013 MFC 直接将 OpenCV2.0/3.0 库中的 Mat 结构的图像传递到 Picture Control(图片控件)
  11. mapbox symbols 层级设置_mapboxgl实现带箭头轨迹线的代码
  12. Jenkinsfile脚本实现master、slave节点(agent)共享内容
  13. java敏感词过滤算法
  14. 拖动滑块验证 php,基于JS组件实现拖动滑块验证功能
  15. Windows 11 (updated Dec 2021) 简体中文版、英文版(64-bit、ARM64)下载(2022 年 1 月发布)
  16. HTML表格做个人简历
  17. 500套优秀简历模板,送给您!
  18. OSChina 周一乱弹 ——强行把她拖到家里洗了个澡
  19. 手机归属地免费接口查询
  20. 传奇服务端初次使用极限插件必看步聚

热门文章

  1. FFT和Matlab中操作FFT
  2. Hibernate Tools 学习总结
  3. Java虚拟机5:常用JVM命令参数
  4. MFC Timer定时器
  5. ios开发--常用的高效开发的宏
  6. Insufficient free space for journal files
  7. 详说 Cookie, LocalStorage 与 SessionStorage
  8. HDU 3282 Running Median 动态中位数,可惜数据范围太小
  9. IOS开发--深拷贝与浅拷贝(mutableCopy与Copy)详解
  10. gsea结果分析图怎么看_数据分析怎么做?看这篇就够了!