目前,实时计算越来越被广泛应用,比如实时ETL、实时报表、实时大屏展示等一些监控预警和在线系统的场景。企业对计算速度和消息更新速度要求越来越高。开源框架中,Storm,Sparks,Flink等在企业生产中大量投入使用,但是开发相对复杂,需要对接各种框架api、sdk等,另外人力成本相对较高。那么有没有一种高效的实时计算平台,只要会写SQL并且可视化的操作就可以快速完成实时计算的业务开发。

阿里云目前推出产品阿里云流计算(公测中,预计18年3月份商业化)(StreamCompute)阿里云流计算全链路示意图

可以简单快速的实现仅用SQL就完成流计算的业务链路,下面我们就使用流计算给大家示范。

架构:

以阿里云流计算为核心,从数据流向上我们可以分为数据从哪里,到哪里去。

本次实验架构为:

Logstash+DataHub+阿里云流计算+RDS-mysql

其中,

Logstash :开源框架,用于采集数据

DataHub:阿里云自主研发大型缓存队列(可以理解为类似开源Kafka )

RDS-mysql:阿里云关系型数据库 mysql版

搭建流程:

第一步:创建DataHub 项目和Topic

具体参考

如图是本次实验创建的:

第二步:搭建Logstash

具体参考

配置文件如下

input {

file {

path => "/Users/yang/test/stream.csv"

start_position => "beginning"

}

}

filter{

csv {

columns => ['name', 'age']

}

}

output {

datahub {

access_id => "LTAIu****Ouj87b"

access_key => "MfY8ONjK6******7OEdyXw4T"

endpoint => "https://dh-cn-hangzhou.aliyuncs.com"

project_name => "M_shangdantest"

topic_name => "to_stream_topic"

#shard_id => "0"

#shard_keys => ["thread_id"]

dirty_data_continue => true

dirty_data_file => "/Users/yang/test/dirty.data"

dirty_data_file_max_size => 1000

}

}

第三步:创建流计算任务

1,可视化注册刚才创建的DataHub数据源,接入数据。如图

2,可视化注册数据输出的数据库RDS-mysql

3,编写从数据来源(DataHub)取数据经过计算写入数据目的源(RDS-mysql)的业务SQL。

代码附上,具体业务逻辑可以自己通过SQL实现:

CREATE TABLE to_stream_topic (

`name` VARCHAR,

age BIGINT

) WITH (

type = 'datahub',

endPoint = 'http://dh-cn-hangzhou.aliyun-inc.com',

roleArn='acs:ram::xxxxx:role/aliyunstreamdefaultrole',

project = 'shangdantest',

topic = 'to_stream_topic'

);

INSERT INTO resoult_stream

SELECT name,age from to_stream_topic;

CREATE TABLE resoult_stream (

`name` VARCHAR,

age BIGINT

) WITH (

type= 'rds',

url = 'jdbc:mysql://rm-xxxxxxx.mysql.rds.aliyuncs.com:3306/lptest',

userName = 'xxxxx',

password = 'xxxx',

tableName = 'resoult_stream'

);

以上操作完成后可以

1,启动logstash

2,测试流计算,调试非常方便,对线上业务没有影响,自动从DataHub中抽取数据进行测试

3,启动流计算作业,如图

4,观察数据是否成功写入RDS-Mysql

到此 流计算一个实时链路搭建完毕,有没有发现很酷炫,只需要写写SQL,加一些数据源的配置即可。整个过程一小时就可以完成,相对开源省去了繁琐的各种环境搭建,代码编写,监控等等。

了解更多请微博关注阿里云客户满意中心

阿里云实时计算对接mysql_一小时完成基于阿里云流计算的实时计算系统搭建相关推荐

  1. 最新发布!《阿里云实时计算 Flink 版解决方案白皮书-2021版》开放下载

    简介:阿里云实时计算 Flink 版解决方案白皮书-2021版正式发布- Apache Flink:全球领先的开源大数据计算引擎 Apache Flink 是一个开源的分布式大数据处理引擎,可对有限数 ...

  2. 下一代大数据处理引擎,阿里云实时计算独享模式重磅发布

    11月14日,阿里云重磅发布了实时计算独享模式,即用户独享一部分物理资源,这部分资源在网络/磁盘/CPU/内存等资源上跟其他用户完全独立,是实时计算在原有共享模式基础上的重大升级. 独享模式优点更加突 ...

  3. 下一代大数据处理引擎,阿里云实时计算独享模式重磅发布 1

    摘要: 11月14日,阿里云重磅发布了实时计算独享模式,即用户独享一部分物理资源,这部分资源在网络/磁盘/CPU/内存等资源上跟其他用户完全独立,是实时计算在原有共享模式基础上的重大升级.(观看实时计 ...

  4. 阿里云实时计算的前世“功”今生“能”

    2019独角兽企业重金招聘Python工程师标准>>> 前言: 不修内功,难成大器.为了将Apache Flink在阿里巴巴真正运行起来,阿里巴巴实时计算团队做了大量的优化,在阿里云 ...

  5. 阿里云实时计算,前世功,今生能!

    前言: 不修内功,难成大器.为了将Apache Flink在阿里巴巴真正运行起来,阿里巴巴实时计算团队做了大量的优化,在阿里云上的产品正式命名为实时计算,以Flink SQL为主要API,致力于打造一 ...

  6. 阿里云实时计算产品经理李佳林:基于 Flink 构建大规模风控系统的技术实战

    本⽂由 Flink 社区志愿者邹志业整理,内容来源⾃阿里云实时计算产品经理李佳林在 7 月 5 日 Flink 峰会(CSDN 云原生系列)的演讲.主要内容包括:基于 Flink 构建风控系统.阿里风 ...

  7. 国内首批!阿里云实时计算 Flink 版通过信通院大数据产品能力测试

    简介:阿里云实时计算 Flink 版通过信通院分布式流处理平台测评,成为国内首批通过测试的厂商. 2021年6月24日,中国信息通信研究院(以下简称"中国信通院")在北京主办&qu ...

  8. 以实时风控场景为例,阿里云实时计算如何来做异常检测?

    内容来源:本文内容由阿里云实时计算,流计算团队提供.IT 大咖说(微信id:itdakashuo)作为独家合作方,经授权发布. 阅读字数:3102 | 8分钟阅读 前言 DT时代,数据是最重要的生产资 ...

  9. 首批+唯一。阿里云实时计算 Flink 版通过信通院大数据产品稳定性测试

    概要 2021年12月13日,中国信息通信研究院新一轮"大数据产品能力评测"结果公布,阿里云实时计算 Flink 版通过分布式流处理平台稳定性专项测评,阿里云成为「首批+唯一」通过 ...

  10. 【阿里云流计算】- 电商订单和销量统计案例

    背景 随着新零售的概念慢慢崛起,互联网电商行业竞争越来越激烈!实时数据信息对于电商行业尤为重要,那如何从实时不断的数据流中获取我们想要的信息呢?以下案例是 流计算的合作伙伴袋鼠云用阿里云流计算来解决电 ...

最新文章

  1. harris角点检测与ncc匹配
  2. Posted content type isn't multipart/form-data
  3. 一蹴而就的解释是什么_聪明的孩子喜欢问“为什么”,还是喜欢问“为什么”让孩子聪明?...
  4. hdu5246超级赛亚ACMer
  5. 微信小程序设置云函数使用的环境
  6. LVS工作总结之原理篇–DR模式
  7. 《网络攻防实践》第七周作业
  8. 虚拟机Centos7配置网络
  9. latex导数_Latex:导数【高中常用公式】
  10. 用户态处理arp、ndisc neighbour solication 报文
  11. nginx负载均衡fair模块安装和配置
  12. 大数据Hadoop(三十):Hadoop3.x的介绍
  13. 学java,报班还是自学?
  14. 不必担心安卓系统被植入棱镜
  15. java spel_Java spring SPEL表达式注入
  16. 海信电视买哪个型号好 2023海信电视系列机型选购推荐
  17. JavaSE学习笔记
  18. win7防火墙设置开放某个端口
  19. 【PAT甲级】字符串处理及进制转换专题
  20. linux系统修改时区

热门文章

  1. xcode run跑项目或者Archive打包项目的时候显示Build Succeeded一闪而过但是程序无反应问题解决
  2. HOUR 13 Developing Advanced References and Pointer
  3. opencv保存设像头图片时调整白平衡功能
  4. Leetcode(347)——前 K 个高频元素
  5. 怎么查违章?查违章哪个软件最好?交管12123处理电子眼不用再跑交警队!
  6. 北京集训TEST12——PA( Mortal Kombat)
  7. Linux刻录光盘win10认不到,Win10系统无法读取DVD光驱和刻录光盘的解决方法
  8. matlab贝塔分布,怎么拟合贝塔分布函数
  9. 2014年实习生招聘之腾讯实习生招聘面试(一面)—2014/04/01
  10. 2021SAAE上海第七届教育装备展览会