在这个“数据即资产”的时代,大数据技术和体量都有了前所未有的进步,若企业能有效使用数据,让数据赚钱,这必将成为企业数字化转型升级的有力武器。

奇点云自研的一站式大数据智能服务平台——DataSimba,旨在提供数据采集、数据加工、数据治理、数据规范、数据资产、数据服务等全链路的产品+技术+方法论服务,构建面向业务应用的大数据智能平台。 其主要核心模块包括了数据开发套件、数据治理套件、数据服务引擎、数据智能、数据安全。

1、数据采集

数据采集作为数据中台第一个环节,不仅仅是要“采集”,也要将数据合理的“存”起来。DataSimba数据采集研发了两套采集工具,一套是批量采集DataX,一套是实时采集DataS。

DataX为批量离线采集工具,支持市面上基本所有的关系型DB、NoSQL等数据库。

DataS为实时的在线采集工具,支持关系型DB的操作日志的实时读取,如MySQL的binlog,也支持网页埋点的服务日志的实时读取。

2、数据开发

数据开发套件作为产品的核心模块,底层是基于hadoop开源生态圈中的Hive、Spark、Flink、Impala为计算引擎,以Hdfs、Hbase、kudu为分布式存储,为数据开发、数据分析、数据挖掘、算法工程师提供了一套可视化开发界面。开发人员可在开发套件上做一站式开发,包括可视化数据同步配置、创建各种开发任务(包括实时任务和离线任务)、数据建模、调度配置、运维监控等,大大地提高了开发人员的开发效率。同时开发套件实时采集了数据表的元信息、表级、字段级的血缘关系,为数据地图提供了丰富的元数据。

3、数据治理

数据治理套件主要围绕开发完成的数据进行一系列的数据质量监控、数据规范定义、数据元信息展示。一方面提供了多种规则模板,监控各个环节任务产出的数据质量,每天定时产出数据质量检测报告,让数据开发对数据的质量做到心中有数,可以及时地修正脏数据;其次提供了元数据管理,形成全局数据地图,分析数据血缘,数据影响,为数据开发与维护提供支撑;最后还帮助开发人员制定一系列的数据标准进行名称、指标、维度的设计规范,统一口径,消除二义性。然后利用数学统计、机器学习、深度挖掘等大数据技术构建企业的标签体系,把原始数据加工成企业可阅读易理解的标签体系,并且应用在不同的业务场合中,帮助企业解决痛点,提升商业价值。

4、数据服务

数据服务引擎打通了应用方和数据的通道,可以让数据紧密的跟业务结合在一起,加速数据业务化过程。传统的数据仓库,通常在已有N个维度中随机挑选几个维度进行大数据量的聚合操作,返回结果集非常缓慢,OLAP引擎可以支持大数据量多维度查询秒级结果返回,大大地提高了工作效率;另一方面传统数仓在报表类数据展示上花费了很大的人力和物力,而且非常难维护开发好的接口,数据API通过可视化模式快速生成接口,并且建立起接口元信息,方便以后的维护,只需要轻松修改下接口元信息即可满足前方业务的变动,而且数据API还提供了接口访问信息的采集与监控,让业务方可以及时地感知到接口的使用情况。

5、数据安全

数据安全可以帮助企业建立数据安全体系。 数据安全在数据访问、数据流动、数据运维等几个关键环节中都加入了身份认证和权限访问控制,通过网络传输加密、高可靠的数据存储、敏感数据脱敏、日志审计、事件溯源、高危操作拦截等功能来保障企业数据的稳定性和安全性。

6、数据模型

好的数据模型,是高内聚低耦合的设计,是可以满足未来业务发展的扩展性。当然也不能过度设计,够用的同时兼顾扩展性。

数据模型设计是一套方法论加上对业务的深刻理解,将业务高度抽象成的多维数据模型结构,模型的数量与复杂度与业务强相关,如大家都比较熟悉的电商业务,按业务过程来切分,可设计为流量数据模型、收藏数据模型、加购数据模型、交易数据模型等。

7、业务模型

前面的业务创新智能化提到,围绕节本增效,业务通过融合后的全域数据、算法技术,将业务经验与数据智能相结合,为运营提高决策效率,如智能选品模型;为业务提升经济价值,如智能折扣模型;为后端部门减少成本,如智能排班模型。

DataSimba作为企业级一站式大数据智能服务平台,产品体系和服务能力随着业务场景不断升级迭代,现已在商业综合体、大时尚、医药、酒类等领域投入使用,实现数据化企业运营,帮助企业能够真正盘活数据资产,创造更多的商业价值!

来自 “ ITPUB博客 ” ,链接:http://blog.itpub.net/69911376/viewspace-2643956/,如需转载,请注明出处,否则将追究法律责任。

转载于:http://blog.itpub.net/69911376/viewspace-2643956/

奇点云数据中台技术汇(一) | DataSimba——企业级一站式大数据智能服务平台相关推荐

  1. python画星环_TranswarpDataHubTDH企业级一站式大数据综合平台白皮书-星环.PDF

    TranswarpDataHubTDH企业级一站式大数据综合平台白皮书-星环 Transwarp Data Hub (TDH) 企业级一站式大数据综合平台 白皮书 星环信息科技(上海)有限公司 目录 ...

  2. 企业级一站式大数据开发平台理论及实践

    点击上方蓝色字体,选择"设为星标" 回复"资源"获取更多资源 前言 本文是个人在从零搭建部门数据及运营平台的过程中的笔记.随着互联网规模不断的扩大,数据也在爆炸 ...

  3. 奇点云数据中台技术汇 | 数据智能模型——数据中台航母的作战集群

    中台是"让听得见炮火的人召唤炮火",面对如火如荼的中台建设潮,只有先解释了"数据该怎么用"的问题,才有必要进一步解答"数据怎么来".&quo ...

  4. 奇点云数据中台技术汇(八) | 数据治理——企业数字化转型的基石

    1 为什么要进行数据治理? 首先,数据是有价值的.根据埃森哲发布的"2035年之前各行业的平均GDP增长率",单纯看自然增长,制造行业只有2.1%,但是通过数据以及由此衍生出来的人 ...

  5. 数据中台技术汇 | CDP,线下零售顾客运营中台

    顾客数据平台(Customer Data Platform,简称CDP),是近年兴起的一种以顾客为核心.聚焦客群细分与人群洞察的企业数据应用平台. 听上去很互联网啊?跟实体行业和零售营销有什么关系呢? ...

  6. 千字搞定数据产品选型!报表、BI、大数据平台、中台都在这了

    来吧,废话不多说,直接上干货! 到现在还在做报表的,已经很少了.上面三家都是中国主流报表厂商.不过在国外BI厂商的市场压力面前,也都做了BI套件.主流的就帆软,水晶报表最近见的少了. 普通小厂,1.2 ...

  7. 数据猿·金猿榜丨2017工业大数据领域最具潜力创业公司

    [数据猿导读] "2017工业大数据领域最具潜力创业公司"盘点源于数据猿推出的"金猿榜"系列内容,旨在通过媒体的方式与原则,发掘大数据领域最具潜力的创新型企业 ...

  8. 【大数据】中国工程院院士何友:工业大数据及其应用

    来源:德先生D-Technologies 工业大数据面临的挑战. 第一是数据搜集,要对来自网络包括物联网和机构信息系统的数据附上时空标签,去伪存真,尽可能收集异源甚至是异构的数据,还可与历史数据对照, ...

  9. 贝壳一站式大数据开发平台实践

    分享嘉宾:仰宗强 编辑整理:刘春龙 出品平台:DataFunTalk 导读:本次分享嘉宾是来自贝壳大数据部门的仰宗强,详细介绍了针对贝壳的业务数据与需求的增长,逐步升级数据开发平台的探索实践过程,包括 ...

  10. 一文读懂数据中台技术架构

    一文读懂数据中台技术架构 https://www.toutiao.com/i6836923386560512516/?tt_from=weixin&utm_campaign=client_sh ...

最新文章

  1. 精读《谈谈 Web Workers》
  2. 2、django管理网站
  3. TransactionTemplate和@Transactional注解的区别
  4. python中max函数用法_Python中max函数用法实例分析
  5. java数组、集合和数据结构知识*
  6. 信访问题归并处理_最高法判例:行政机关以信访形式处理履行法定职责问题的起诉期限...
  7. 基于JAVA+SpringBoot+Mybatis+MYSQL的高铁售票系统
  8. shell统计游戏活跃用户数之改进过程分析
  9. 修改system.img的大小限制
  10. UCOS内核结构学习笔记
  11. Leetcode: Maximal Square
  12. Java Web应用程序开发-深入体验Java Web开发内幕之初步
  13. 服务器IO测试(Iozone使用)
  14. Mybatis提高查询效率的方式
  15. SAM-BA AT91 USB to Serial converter驱动安装失败解决方法
  16. 如何快速查询京东快递物流正在派送中的单号
  17. O2O、C2C、B2B、B2C是什么意思 有什么区别
  18. 打开APP validate fail
  19. 【知识】快乐物质:多巴胺和内啡肽(内酚酞)的区别
  20. zarchiver解压提示出错_zarchiver解压操作出错怎么办 zarchiver解压操作出错解决办法...

热门文章

  1. jpa 人大金仓数据库方言_人大金仓+springboot配置
  2. 宏定义是什么?为什么要进行宏定义?宏定义的格式
  3. 解决Sheet can not be presented because the view is not in a window这样的问题
  4. 域名升级访问中拿笔记好_好记性也应做笔记,安利一款比onenote更好用的云笔记工具...
  5. c语言的32位指针加1是多少,c语言中,指针加1的情况.指针变量详细介绍
  6. Android版本手机怎么截屏,安卓手机怎么截屏的4种方法
  7. 打开心扉计算机谱子,教你演唱咏叹调《人们叫我咪咪》(附曲谱)丨选自普契尼歌剧《艺术家的生涯》...
  8. html 隐藏tbody,隐藏的tbody
  9. USACO-Section3.2 Feed Ratios【克莱默法则】
  10. 跑步减肥的正确姿势与方法 不再担心女生跑步腿会变粗