第一个接触wormhole是公司的一个开发项目,由于之前供职于宜信,接触到这个开源项目,目前宜信已经推出Davinci、Moonbox、Wormhole、UAV.Monitor等10项领先开源技术,以将宜信的技术和方法开放共享,繁荣技术生态。

开源网址: https://github.com/edp963/wormhole

wormhole的简介:

  • Wormhole是一个SPAAS(Stream Processing as a Service)平台解决方案。Wormhole面向大数据项目开发和管理人员,致力于简化和统一开发管理流程。尤其是针对流式实时和流式准实时数据处理场景,Wormhole提供了可视化的操作界面,极简的配置流程,基于SQL的业务开发方式,并屏蔽了大数据处理底层技术细节,极大的降低了开发管理门槛,使得大数据项目开发和管理变得更加轻量敏捷可控可靠。

Wormhole的设计理念:

  • 统一流式处理DAG高阶分形抽象:构建由 Source DataSys,Kafka Topic,Spark Stream(Flink Stream),Sink DataSys 组成的物理 DAG;每个物理 DAG 里可以并行处理多个由 Source Namespace,Flow,Sink Namespace 组成的逻辑 DAG;每个 Flow 本身是典型的 Spark RDD DAG
  • 统一通用流转消息UMS协议抽象:UMS 是 Wormhole 定义的流消息协议规范;UMS 试图抽象统一所有结构化消息;UMS 自身携带结构化数据 Schema 信息;Wh4 支持用户自定义半结构化 JSON 格式
  • 统一表命名空间Namespace定义抽象:Namespace 唯一定位所有数据存储所有结构化逻辑表;[Data System].[Instance].[Database].[Table].[Table Version].[Database Partition].[Table Partition]

wormhole的基本原理:

正在总结。。。。。。。。。。(马上更新)

大数据起步之wormhole初识相关推荐

  1. 大数据(1)--初识

    目录标题 1.大数据 1.1 什么是大数据? 1. 2 大数据相关技术 1.2.1 海量数据获取 1.2.2 海量数据存储 1.2.3 海量数据清洗 1.2.4 海量数据处理 2.网站日志分析系统 2 ...

  2. 大数据Impala系列之初识Impala

    一.impala 概述 1.什么是Impala? Impala是用于处理存储在Hadoop集群中的大量数据的MPP(大规模并行处理)SQL查询引擎. 它是一个用C ++和Java编写的开源软件. 与其 ...

  3. 大数据python试卷_大数据起步--Python语言-中国大学mooc-试题题目及答案

    中档饭店清扫房间定额一般为().A.1416间/人B.1214间/人C.1012间/人D.810间/人 一般情况下,能发生瓦斯爆炸的最低氧气浓度为()A.8%B.12%C.20%D.18% P ...

  4. 实习一年,自学从Java转向大数据开发

    大学如何自学java的文章: https://blog.csdn.net/CatchLight/article/details/112260371 第一份实习offer 专升本的第一学年末,凭借着自学 ...

  5. 企业大数据运用实战案例分享

    一.企业大数据如何起步:从小数据到大数据 目前国内外关于大数据的谈论很多,大多是谈运营级别的,或者说从服务端.服务方提得较多一些.笔者要跟大家交流的问题是作为各类企业尤其是客户方的企业来说,大数据跟他 ...

  6. 大数据时代了解一些问题

    大数据时代了解一些问题 从2014年开始,大数据备受整个社会的关注!不管是从政府层面,还是到企业层面,对大数据的关注以及研究都是非常火热的!不过,很多人尽管听说了大数据这个东西,但是对这个领域仍然很陌 ...

  7. python大数据就业方向_大数据专业未来的就业方向有哪些?[黑马程序员]

    目前大数据是一个十分热门的行业.一个行业的兴起必定会衍生出相对应的岗位.本篇文章给大家总结下学习大数据后未来可以就业的方向,给大家提供参考. 在数据驱动的未来,大数据人才市场势必会越来越大,而现在仅仅 ...

  8. 零基础想学大数据?别急!先搞清这一点

    在入行大数据开发之前,相信很多同学都存在一些疑虑. 现在入行大数据有前途吗? 学大数据一定要会Java开发吗? 我是零基础,对大数据什么都不懂,能学好吗? .... 大数据时代,给想从事IT行业的人带 ...

  9. 一篇文章告诉你大数据的重要性

    在这10年中,几乎所有行业都或多或少的受到大数据的影响.科技渗透到各个领域,并且已经成为每个处理单元的必要元素.谈到IT行业,具体来说,软件和自动化是较基本的术语,并且用于处理循环的每个阶段 毫无疑问 ...

最新文章

  1. Producing Open Source Software
  2. 7、MySQL默认值(DEFAULT)
  3. 工厂模式例子之计算器的实现
  4. 在Android App中集成Google登录
  5. Mybatis高级应用 查询缓存
  6. JavaScript 火的有点过头了,但又能火多久呢?
  7. 网页编辑器粘贴word格式的处理
  8. linux多线程如何分配到多核上,Linux多线程编程 多核编程
  9. Tomcat(二)环境变量配置
  10. 机器学习:学习的分类
  11. 多张图片合成一个tif文件
  12. 解决vscode的任务栏白色图标的问题
  13. 记一次npm安装依赖奇怪的gyp报python错误
  14. EasyExcel生成多个excel.xlsx进行压缩导出
  15. 阿迪卫衣79/茅台茅韵两瓶149/南极人内裤4条14.9/八杯水九件套59.9
  16. MAX7219产品级驱动分享
  17. JAVA练习题17:文字版格斗游戏
  18. 域适应(DA)---域泛化(DG)
  19. 项目管理中的三大误区
  20. 51nod 1001

热门文章

  1. 名片管理系统java_java毕业设计_springboot框架的名片管理系统
  2. HTML 修改滚动条样式
  3. python 提取列表中长度大于3的字符串,列表中什么元素都有
  4. Android网络功能开发(5)——Socket编程接口
  5. Python图像识别-Opencv07 异或运算,图像加密
  6. Python案例分析之客户信贷预测模型
  7. 这些响应式网页测试工具确保你的设计万无一失
  8. Jmeter 之 Beanshell 用法
  9. 版本控制工具VSS使用介绍
  10. 常见路由协议总览以及路由协议分类方式