第5章 数据汇聚联通:打破企业数据孤岛要构建企业级的数据中台,第一步就是要让企业内部各个业务系统的数据实现互联互通,从物理上打破数据孤岛,这主要通过数据汇聚和交换的能力
来实现。在面向具体场景时,可以根据数据类型将汇聚对象分为结构化和非结构化、大文件和小文件、离线与在线等几种。5.1 数据采集、汇聚的方法和工具1.线上采集行为线上采集的主要载体可以分为传统互联网和移动互联网两种,对应的形态有PC系统、PC网页、H5、小程序、App、智能可穿戴设备等。在技术上,数据采集主要有客户端SDK埋点和服务端SDK埋点等方式。 1.客户端埋点a)全埋点将终端设备上用户的所有操作和内容都记录并保存下来,只需要对内嵌的SDK做一些初始化配置就可以实现收集全部行为的目的。这也经常被称为无痕埋点、无埋点。b)可视化埋点将终端设备上用户的一部分操作,通过服务端配置的方式有选择性的记录并保存。c)代码埋点根据需求来定制每次的收集内容,需要对相应的终端进行升级。2.服务端埋点通过在系统服务器端部署相应的数据采集模块,将这部分数据作为行为数据进行处理和分析。常见的形态有HTTP服务器的access_log。2.线下采集行为线下行为数据主要通过一些硬件采集,如常见的Wi-Fi探针、摄像头、传感器等。通过Wi-Fi信号采集周边移动设备是之前比较常用的方式,其主要原理是通过信号探测的协议,当热点附近的移动设备在探测SSID时,会建立网络连接,从网络协议中获取手机的网络设备号。3.互联网数据采集网络爬虫常用来做网站的自动化测试和行为模拟。4.内部数据汇聚从数据组织形式来分,数据主要分成三类:1.结构化数据能通过二维逻辑来表现的数据,如数据库、excel等二维表。2.半结构化数据数据规则完整,同样严格遵循数据格式与长度规范&

5.数据中台 --- 数据汇聚联通:打破企业数据孤岛相关推荐

  1. 赠书 | 如何建设数据中台?看这份企业数据能力测评就够了!

    作者 | 耿立超 来源 | <大数据平台架构与原型实现:数据中台建设实战> "我的企业目前在数据应用上处于什么水平?接下来应该朝哪个方向努力?"本文试图帮助企业决策者和 ...

  2. 数据中台(01)- 全面了解数据中台

    文章目录 01 数据中台起源 02 数据中台的定义 2.1 数据中台建设目标 2.2 如何实现建设目标 2.3 数据中台定义与特点 03 大数据平台与数据中台 3.1 为什么要建设数据中台 3.2 数 ...

  3. 数据中台交付专家告诉你,数据架构的分层怎样更加合理?

    作者:柯根 从整体上看,数据中台体系架构可分为:数据采集层.数据计算层.数据服务层三大层次.通过这三大层次对上层数据应用提供数据支撑. 数据采集层 对于企业来说,每时每刻都在产生海量的数据,数据采集作 ...

  4. 爱奇艺数据中台负责人马金韬:数据中台建设与应用

    中生代技术 链接技术大咖,分享技术干货 接力技术,链接价值 本文根据马金韬老师在[deeplus直播第233期]线上分享演讲内容整理而成.首发于公众号dbaplus,经授权转载(文末有获取本期PPT& ...

  5. 数据中台 第5章 数据汇聚联通:打破企业数据孤岛

    要构建企业级的数据中台,第一步就是要让企业内部各个业务系统的数据实现互联互通,从物理上打破数据孤岛,这主要通过数据汇聚和交换的能力来实现.在面向具体场景时,可以根据数据类型将汇聚对象分为结构化和非结构 ...

  6. 阿里云数据中台全新产品DataTrust聚焦企业数据安全保障

    简介:DataTrust(隐私增强计算产品)是基于阿里云底层多项基础安全能力,经过阿里云数据中台丰富的客户业务实践,构建的一款为企业数据安全流通的产品. 随着包括零售.制造.金融等多行业数字化转型加速 ...

  7. 重磅发布 阿里云数据中台全新产品DataTrust聚焦企业数据安全保障

    简介: DataTrust(隐私增强计算产品)是基于阿里云底层多项基础安全能力,经过阿里云数据中台丰富的客户业务实践,构建的一款为企业数据安全流通的产品. 随着包括零售.制造.金融等多行业数字化转型加 ...

  8. 奇点云数据中台技术汇(八) | 数据治理——企业数字化转型的基石

    1 为什么要进行数据治理? 首先,数据是有价值的.根据埃森哲发布的"2035年之前各行业的平均GDP增长率",单纯看自然增长,制造行业只有2.1%,但是通过数据以及由此衍生出来的人 ...

  9. 数据中台 画像标签_如何通过数据中台标签平台,圈出产品高价值用户?

    编辑导语:对于不少公司来说,自身拥有的资源是有限的,因此需要进行差异化运营,将资源着重倾斜给高价值的用户,首先满足他们的需求,缩减分给低价值用户的资源.那么,应该如何去做呢?本文作者通过数据中台标签平 ...

  10. ai人工智能的数据服务_AI如何帮助提高企业数据质量

    ai人工智能的数据服务 Hardly anyone relying on data can say their data is perfect. There is always that differ ...

最新文章

  1. 在Ubuntu虚拟机中安装VMware tools异常中断
  2. 「珍藏」老司机为你推荐10个炫酷的开源库,看完的人都收藏了
  3. app怎么嵌套vue页面_app内嵌vue单页面应用的一些坑
  4. IE9正式版已完成 截图曝光
  5. 一步一步教你使用AgileEAS.NET基础类库进行应用开发-基础篇-使用UDA操纵SQL语句...
  6. 20200224:跳跃游戏(leetcode55)
  7. 【redis】spring boot利用redis的Keyspace Notifications实现消息通知
  8. java防xss攻击_java 防止xss攻击
  9. 腾讯社交广告大赛总结
  10. JVM上篇:内存与垃圾回收篇--运行时数据区四-程序计数器
  11. 产品设计学习(三)——用户画像与特征工程
  12. android课程设计的需求分析,安卓课程设计心得体会.doc
  13. Qt QPainter CompositionMode解读及图片透明度设置
  14. 调侃计算机专业的笑话,段子手要失业了 计算机也懂幽默
  15. 人工智能的发展方向与机遇
  16. 玩转Linux的下Ip计算器(图文)
  17. signal信号详解
  18. 【uniapp】微信小程序微信授权新旧解决方案
  19. 插画人物着色教程,如何为动漫插图人物添加颜色?
  20. C# IDE SharpDevelop的一些缺陷

热门文章

  1. Thread.Sleep太久,界面卡死
  2. Oracle系统表大全(转)
  3. [翻译] FBLikeLayout
  4. 从客户端(content=span class=Apple-s...)中检测到有潜在危险的 Request.Form 值。
  5. 用时间序列的方法处理数据
  6. Egret入门学习日记 --- 第十七篇(书中 7.4~8.2节 内容)
  7. form表单提交数据
  8. 【Oracle】等待事件详细内容
  9. Linux中下载,压缩,解压等命令
  10. U3D关于message的使用