数据域是什么?

第一次接触这个概念,是看《大数据之路-阿里巴巴大数据实践》的第九章。可里面对数据域的描述内容很少,在体系架构中却是个很重要的节点。
我能大概的想像出它是什么样子,但因为信息太少,根本不知道为什么会存在数据域这个东西,没有它会有什么问题?划分了数据域又能带来什么好处?

后来在实际工作中,慢慢的把数据域的划分当做数仓表分类来做,发现基于这样的定义,数据域还是很有价值的。
也许跟原本真实的含义差别很大,但解决了我们很多真实存在的问题。

数据仓库存在的时间越久,数据内容会越多。点我达表最多的时候,有5000多张。
想要在这么多表中,寻找到自己需要的内容太过困难。
记不住,找不到,难以使用,无法管理,维护困难。就像使用windows系统,所有的文件都在桌面一样。

域是区域的意思,有边界和范围。
数据域我理解是对数据进行一种类似地理区域划分的结果,不重不漏。
假设把数据仓库的表比作中国的村庄或城市街道,为了更好地管理,中国会划分为几十个省和直辖市,省划分十几个地级市,地级市再划分N个县或市这样。最终每一个村庄或街道这样的最小单位,都变成了某省某市某县的某村。

而某个具体的表也会变成某个业务下的某个子业务的某个模块的某个功能下的一部分。我只要记住少数类别,就可以迅速定位到最可能是我需要的数据的域里,快速找到我需要的内容。同类数据存放在一起,还有利于我的理解。

数据域划分就是对数据分类。而基于不同的目的,有不同的分类标准。
比如开发更倾向于基于数据来源的差异划分,相同功能模块的数据划分在一起。运营更倾向基于数据应用目的的差异划分,解决类似问题的数据划分在一起。
我觉得每个人都应该可以创建满足自己目的的数据域,来方便管理和查找数据。

数据域的划分有几点需要注意的地方
1.不重不漏,确保每个表都在一个域里,且只在一个域里(精确定位)
2.每个域下都可以根据需要再分子域,不限定层级(最自由方便)
3.如果分子域就不能放表,表只放在最底层的域中(树状目录管理时更方便)
4.最好保证每个域下的子域数量或表数量在20个左右(太多了不方便记忆管理,太少了没必要划分)
5.【其他】很好用,不好划分的都放里面(减少域层级数量有理由理解记忆)
6.数据团队分域可以作为分工的标准(数据不重、分工明确、界限清晰)
7.数据团队分域后,可以决定域内表的中间命名(看到表名时可以理解更多信息)

也许我没能真正理解并发挥数据域的作用,也许我对数据域的认识错的离谱。
但我想的却是照搬经典或权威的结果是最好的使用方式吗?人家为什么那么做?碰到了什么问题?有那些限制?有那些资源?如果这些都不了解拿来就用,这就是邯郸学步吧,还不如不用得好。
而我虽然拿了些皮毛,但能结合眼前的问题和现状,经过思考,提供了对问题解决有帮助的办法,也是当前较好的选择了。

国学有“六经注我”和“我注六经”的说法,我这算是六经注我了。


点击 数据文章目录 查看更多


注: 以上所有内容不确保正确准确, 仅是个人思考的结果, 欢迎交流沟通
V1.0 2020年10月14日

概念-数据域是什么?相关推荐

  1. 谈笑间学会数仓—主题域数据域

    谈笑间学会数仓-主题域&&数据域 在之前的文章里虽然没有按照顺序来,但是基本上都介绍了数据仓库建设的大概流程,比如技术架构方案设计.建模方法论.数仓分层.开发规范.数仓建设中的各种事实 ...

  2. 聊聊数据域和主题域的区别

    大家好,我是大D. 这篇文章跟大家一起聊下数仓中比较容易混淆的两个概念--数据域.主题域.有的公司对二者的界限并不明显,都统一称为数据域或者主题域:也有的公司两者是区分开使用的,那么数据域和主题域有什 ...

  3. 域添加另一台机器_巨杉Tech | SequoiaDB数据域概念解读与实践

    近年来,银行各项业务发展迅猛,客户数目不断增加,后台服务系统压力也越来越大,系统的各项硬件资源也变得非常紧张.因此,在技术风险可控的基础上,希望引入大数据技术,利用大数据技术优化现有IT系统实现升级改 ...

  4. CocosCreator微信小游戏排行榜及开放数据域的理解与使用

    微信小游戏开放数据域及排行榜的使用 好久没有写博客了,距离上一次博客,已经有了近半年之久,这段时间发生了太多的事,当然,这些不是今天的主题,接下来我们主要讲一讲微信小游戏开放数据域的使用,以及如果制作 ...

  5. 巨杉Tech | SequoiaDB数据域及存储规划

    1 背景 近年来,企业的各项业务发展迅猛,客户数目不断增加,后台服务系统压力也越来越大,系统的各项硬件资源也变得非常紧张.因此,在技术风险可控的基础上,希望引入大数据技术,利用大数据技术优化现有IT系 ...

  6. Creator开放数据域排行榜wx.setUserCloudStorage,KVDataList,getFriendCloudStorage,keyList,postMessage,onMessage

    //*********************************************************** [[一]]主域介绍 **************************** ...

  7. 数仓建设:数据域和主题域是什么关系?

    为什么会有域的概念呢? 首先来看看数据仓库的定义吧,数据仓库是一个面向主题的.集成的.相对稳定的.反映历史变化的数据集合,用于支持管理决策. 主题域已经体现出来了 主题域用于将数据集市按照分析视角进行 ...

  8. c语言节点有指针域数据域,学习心得:链表的操作(C语言实现)

    今天将给大家讲述链表的学习心得.学习数据结构,毋庸置疑链表必须学好,后面的栈.队列.树.图都是以链表为基础的:链表的种类很多,有单链表.双链表.循环链表.非循环链表:在此,我们以非循环单链表为例,来讲 ...

  9. Java黑皮书课后题第10章:***10.8(金融:Tax类)编程练习题8.12使用数组编写一个计算税款的程序。设计一个名为Tax类,该类包含下面的实例数据域

    ***10.8(金融:Tax类)编程练习题8.12使用数组编写一个计算税款的程序.设计一个名为Tax类,该类包含下面的实例数据域 题目 程序解释 代码 Test8.java Test8_Tax.jav ...

最新文章

  1. Core禁用BIP70或只为制造闪电网络硬需求
  2. python里的os模块_python中os模块再回顾
  3. eclipse编译hadoop插件
  4. python查看数据大小_科多大数据带你看Python可以列为最值得学习的编程语言
  5. 电子政务档案管理系统源码_高校档案信息化建设的必要性
  6. Plants vs. Zombies(二分好题+思维)
  7. gmail api 发送邮件_Node定时自动发邮件功能
  8. 因子分析在SPSS中的应用
  9. 山东大学电路分析实验1 万用表的使用
  10. 【U8+】去掉填制凭证界面金额中的网格
  11. 20190729杭电多校第三场
  12. android手机游戏-三国无双(二)
  13. 播放器可以完成:开机自动打开指定网页,自动运行浏览器打开指定的网页。
  14. java-使用 flying-saucer 通过 xhtml 生成 pdf 文档支持 css 和 图片
  15. t检验、方差分析、卡方检验统计量的构造
  16. 如何安装 Composer
  17. PHP经典实例(第二版) php实例大全
  18. 电脑桌面云便签怎么通过便签快捷键设置窗口置顶或置底?
  19. Docker 教学版本-v1.0.0
  20. 昂首阔步迈入大数据时代

热门文章

  1. matlab生成一个均为1的列向量,matlab产生列向量
  2. 利用MATLAB打造属于自己的无人机遥感图像处理系统(1)
  3. nnUNet安装踩坑记录
  4. 哪种蓝牙耳机戴着最舒服?佩戴最舒服的真无线蓝牙耳机
  5. 我告诉你2019年,该怎样去系统学习大数据,知识+内容+教程
  6. CentOS开启telnet服务
  7. 爬取笔趣阁小说网站上的所有小说(一)
  8. 基于GAN框架的时间序列异常检测研究综述
  9. 提取pdf文件中文字的两种方法
  10. 区块链技术开发的常备语言总结