数据仓库整合各系统码表和参数表

在建立数据仓库时,需要调研涉及到各个源系统,根据各源系统的码值,可分为如下几种类型,针对不同类型的代码做整合。

各码表及参数表类型

通用类代码
通用代码,包含有行政区划、币种、行业分类、国别与地区等。
GB/T 2260-2007 中华人民共和国行政区划代码
GB/T 2659-2000 世界各国和地区名称代码
GB/T 4754-2017 国民经济行业分类
GB/T 12406-2008 表示货币和资金的代码

手工录入代码
各个系统中代码表中不存在的字典码值,也不是标准类的代码,比如一些标志、是否、或者记录在表注释中的代码值,比如comment 0 未确定、1 确定;0 未审核 1 审核通过 2 审核不通过等,需要手工维护到数据仓库码表中(总之就是系统不存在的、或难以取得的、手工维护更加方便的,且还需要关联使用的)。

直接加载使用
各个系统码值直接加载过来并使用,代码值无需转换。通常是某个系统使用而其他系统不会使用。在进入仓库时,需要按照仓库的规则修改下表的名称。

转换加载使用
各个系统码值直接加载无法使用,需要做转换合并处理,比如证件类型,客户类型,机构类型等。
比如A系统有证件类型1,2,3,4 分别代码 身份证,户口本,临时身份证,其他。
而B系统又证件类型为:01,02,03,04,05,06,身份证,户口簿,警官证,士兵证,临时身份证,其他证件。
而又性别 F/M、0/1、1/2分别代表不同系统的男女。而数据仓库需要做代码的整合统一。

代码标准编码方式

  1. 应优先采用国际标准、国家标准、企业行业数据标准进行编码 GB(可以参考国家标准)。
  2. 应优先使用数字进行编码0、1、2。
  3. 代码编码应该不重复,不遗漏,不存在歧义。
  4. 对于有代码层级的编码,建议在编号中进行体现 001001…。
  5. 没有层级的编码可以采用自然增长的序列1、2、3、4…。
  6. 对于标志类代码可采取0、1的方式进行编码。

代码标准的维护

  1. 建立代码维护制度体系,规范流程。
  2. 使用文档记录全部的代码信息以及维护记录。
  3. 使用工具脚本进行代码检查(对于重复代码、新增代码等做检查)。

未完待续.

数据仓库整合各系统码表和参数表相关推荐

  1. 云视睿博流媒体服务器Lit,《云视睿博流媒体服务器参数表.docx

    <云视睿博流媒体服务器参数表 云视睿博流媒体服务器参数表2015-10-12更新项目指标系统版本NTV Media Server 3.6NTV Transcoding Engine 2.0操作系 ...

  2. 什么是大数据?漫谈大数据仓库与挖掘系统

    什么是大数据?漫谈大数据仓库与挖掘系统 任何比较关注业界新闻的人,都会知道近两年数字信息领域的几个关键字: 移动端.LBS.SNS和大数据(Big Data).前边三个,大家应该是很熟悉的,因为身边早 ...

  3. 即时聊天IM之二 openfire 整合现有系统用户

    合肥程序员群:49313181.    合肥实名程序员群:128131462 (不愿透露姓名和信息者勿加入) Q  Q:408365330     E-Mail:egojit@qq.com  综述: ...

  4. data-role参数表:

    data-role参数表: data-role参数表: page        页面容器,其内部的mobile元素将会继承这个容器上所设置的属性 header     页面标题容器,这个容器内部可以包 ...

  5. DAX/PowerBI系列 - 参数表(Parameter Table) - 大客户分析(Top N)

    DAX/PowerBI系列 - 参数表(Parameter Table) - 大客户分析(Top N) 难度: ★☆☆☆☆(1星) 适用范围: ★★★☆☆(3星) 概况:此文为DAX/PowerBI系 ...

  6. 微信整合CRM系统的好处

    如今微信的用户体量已经超过了12亿,是国内用户粘度较高的社交平台.另一方面电话开发客户的接通率已经不足10%,这就要求企业不得不转变思路了.微信整合CRM系统能带来非常多的好处.将微信公海转变为企业私 ...

  7. PC式微WP龟速增长:微软或整合三大系统

    微软旗下三大系统有望实现大一统.据媒体报道,微软日前暗示,微软最终将合并Windows RT.Windows 8和Windows Phone三大核心系统,今后可能只有一个版本的Windows.目前PC ...

  8. IRF系列场效应管参数表

    IRF系列场效应管参数表 IRF系列场效应管参数表(IRF9Z10-IRF633) IRF系列场效应管参数表(IRF634-IRFC9014) IRF系列场效应管参数(IRFC9024-IRFIP05 ...

  9. matlab仿真建立机器臂模型并得到其D-H参数表

    最近老师要求我们在matlab中构造下图机器人的模型 其初步构型长这样 想要实现图示关节的构型,必须在正确的坐标位置绘制出圆柱体(为圆柱指定位置和z轴方向),那么就必须先获得机器臂各个关节的位姿(位置 ...

  10. 数据仓库在税务系统的应用现状

    昨天在网上看到了一个关于数据仓库在税务系统的应用现状的帖子,如获至宝,马上收之: 全国税务做数据仓库的比较少, 成功的应用更是少. :-( 我知道的情况是如下的: 项目 主要应用方面 开发商 进度 1 ...

最新文章

  1. Spring 数据源配置与应用
  2. 数据挖掘技术简介[转]
  3. ERROR: This virtual machine appears to be in use
  4. Python学习日记(3)Python内建函数map()、filter()和匿名函数表达式
  5. python处理表格很厉害么_还在用excel?太落伍了,现在都用Python和Jupyter处理数据了...
  6. php通过header发送自定义数据
  7. C语言求素数的几种方法
  8. java使用odbc连接数据库连接_Java使用ODBC连接数据库
  9. 参数显著性检验的p值小于显著性水平不等于其具有经济学意义
  10. 计算机word文档基本操作,Word常用基本操作
  11. 列车停站方案_基于节点分级的高速铁路列车停站方案设计策略
  12. 3GPP 5G协议规范
  13. 我第一个用DirextX做的2D游戏——炮炮兵考眼力
  14. Composer 简介和基本用法
  15. C++中UTF-8, Unicode, GB2312转换及有无BOM相关问题
  16. JAVA-动态代理和AOP
  17. 旅途的意义 ——《解忧杂货店》
  18. Notion-我的最后一款笔记应用
  19. 八维计算机学校张家口,八维学校真实校园情况?
  20. 今天你被 SCRUM 祸害了没有?

热门文章

  1. ghost还原提示an internal
  2. SoapUI5.1.2安装和破解教程
  3. 普中科技51单片机——keil的介绍和PZ-ISP无法烧录问题
  4. 河南科技学院新科学院计算机,河南科技学院新科学院
  5. JAVA删除文件或者文件夹
  6. Java——删除文件
  7. 88se9230 linux raid,Marvell发布全球首颗PCI-E 2.0 x2 SATA 6Gbps主控
  8. uat环境是什么环境_什么是开发环境、测试环境、UAT环境、仿真环境、生产环境(收集整理)...
  9. 明明安装了Java,但是Linux ROOT用户却找不到Java命令
  10. 用Matlab分享一个软件低通滤波算法