数据脱敏(Data Masking)

数据脱敏也叫数据的去隐私化,在给定脱敏规则和策略的情况下,对敏感数据比如 手机号、银行卡号 等信息,进行转换或者修改的一种技术手段,防止敏感数据直接在不可靠的环境下使用。
数据脱敏又分为静态数据脱敏(SDM)和 动态数据脱敏(DDM):
SDM适用于将数据抽取出生产环境脱敏后分发至测试、开发、培训、数据分析等场景。
DDM一般用在生产环境,访问敏感数据时实时进行脱敏,因为有时在不同情况下对于同一敏感数据的读取,需要做不同级别的脱敏处理,例如:不同角色、不同权限所执行的脱敏方案会不同。

注意:在抹去数据中的敏感内容同时,也需要保持原有的数据特征、业务规则和数据关联性,保证我们在开发、测试以及数据分析类业务不会受到脱敏的影响,使脱敏前后的数据一致性和有效性。总之一句话:你爱怎么脱就怎么脱,别影响我使用就行。

数据脱敏方案

1、无效化

无效化方案在处理待脱敏的数据时,通过对字段数据值进行 截断、加密、隐藏 等方式让敏感数据脱敏,使其不再具有利用价值。一般采用特殊字符(*等)代替真值,这种隐藏敏感数据的方法简单,但缺点是用户无法得知原数据的格式,如果想要获取完整信息,要让用户授权查询。

2、随机值

随机值替换,字母变为随机字母,数字变为随机数字,文字随机替换文字的方式来改变敏感数据。这种方案的优点在于可以在一定程度上保留原有数据的格式,往往这种方法用户不易察觉的。

3、数据替换

数据替换与前边的无效化方式比较相似,不同的是这里不以特殊字符进行遮挡,而是用一个设定的虚拟值替换真值。比如说我们将手机号统一设置成 “13651300000”。

4、对称加密

对称加密是一种特殊的可逆脱敏方法,通过加密密钥和算法对敏感数据进行加密,密文格式与原始数据在逻辑规则上一致,通过密钥解密可以恢复原始数据,要注意的就是密钥的安全性。

5、平均值

平均值方案经常用在统计场景,针对数值型数据,我们先计算它们的均值,然后使脱敏后的值在均值附近随机分布,从而保持数据的总和不变。

6、偏移和取整

这种方式通过随机移位改变数字数据,偏移取整在保持了数据的安全性的同时保证了范围的大致真实性,比之前几种方案更接近真实数据,在大数据分析场景中意义比较大。

数据脱敏(Data Masking)学习相关推荐

  1. 数据脱敏 Data Masking

    一. 数据脱敏是什么? 数据脱敏顾名思义就是对敏感数据进行变形处理,其目的是保护隐私数据等信息的安全,例如机构和企业收集的个人身份信息.手机号码.银行卡信息等敏感数据.数据脱敏从技术上可以分为静态数据 ...

  2. 数据融合(Data Fusion)学习

    定义及原理 数据融合技术是指利用计算机对按时序获得的若干观测信息,在一定准则下加以自动分析.综合,以完成所需的决策和评估任务而进行的信息处理技术.(百度百科) Data fusion is the p ...

  3. 数据中心Data Center——学习与理解

    数据中心 大型数据中心示意图 数据中心相关概念 对数据中心发展及现有理解 传统数据中心概述 现代数据中心概述 为什么需要大二层? 那么又为什么非要实现虚拟机的热迁移呢? 传统网络的二层为什么大不起来? ...

  4. 云小课|大数据时代的隐私利器-GaussDB(DWS)数据脱敏

    阅识风云是华为云信息大咖,擅长将复杂信息多元化呈现,其出品的一张图(云图说).深入浅出的博文(云小课)或短视频(云视厅)总有一款能让您快速上手华为云.更多精彩内容请单击此处. 摘要: 数据仓库服务Ga ...

  5. 数据脱敏python

    最近在对数据做脱敏的事情,第一次接触这方面的,所以将自己的做法记录了下来,希望对大家有所帮助,仅是自己的一点拙见. 1.数据脱敏定义 数据脱敏(Data Masking),又称数据混淆.数据漂白.数据 ...

  6. 数据脱敏——什么是数据脱敏

    一.什么是数据脱敏? 数据脱敏(Data Masking),又称数据漂白.数据去隐私化或数据变形. 百度百科对数据脱敏的定义为:指对某些敏感信息通过脱敏规则进行数据的变形,实现敏感隐私数据的可靠保护. ...

  7. 数据脱敏(Data Masking)- 模块功能设计

    数据脱敏(Data Masking)- 模块功能设计 脱敏算法管理模块 算法类型取决于后台定制的算法类,表数据手动维护即可. 算法列表展示 算法维护-可根据程序提供的算法类型进行自定义算法. 算法删除 ...

  8. Azure SQL Database (23) Azure SQL Database Dynamic Data Masking动态数据掩码

    <Windows Azure Platform 系列文章目录> 我们在使用关系型数据的时候,有时候希望: - 管理员admin,可以查看到所有的数据 - 普通用户,某些敏感字段,比如信用卡 ...

  9. 吴恩达神经网络和深度学习-学习笔记-38-使用开源的方案+迁移学习+数据增强data augmentation

    使用别人的开源成果 想要用现成的网络,最好在网络上找到开源的实现,这要比从头开始实现快得多. 比如:直接在Google上搜索resnets github,找到合适的后点击下载会得到URL,然后在cmd ...

最新文章

  1. Python字符串介绍
  2. Golang——文件创建和写入、OpenFile追加写入、Open读取文件、ReadBytes缓冲区读取、os.Args、flag
  3. Postgres用returning实现mysql的last_insert_id
  4. bash脚本运行报错问题原因及解决方法
  5. java图片透明化处理_java的图片背景透明及透明度处理
  6. pdf-xchange pro注册码
  7. 协议和代理模式的概念
  8. uniapp 点击动画_uni-app animation动画
  9. windows系统背景淡绿护眼色设置
  10. 用C语言程序求两个正整数的最大公约数
  11. win10 更新1803版本后删除自带微软拼音的方法
  12. thinkphp3.1.3框架手册
  13. 浅谈当下火热的ChatGPT
  14. Windows10+YOLOv5训练自己的数据集
  15. 第十九章、主機名稱控制者: DNS 伺服器
  16. log4j日志文件模板配置整理
  17. 谁知道尾行4出了没有,有没有人想玩的,给大家看看什么叫被雷到了 囧
  18. 机房安全监控设备连接图及指令发送
  19. 体会Linux与生俱来的美 ---摘自csdn
  20. Codeforces Round #742 (Div. 2) 个人题解

热门文章

  1. nRF24l01无线传输
  2. 数字电路之组合逻辑电路
  3. 编写函数比较字符串的大小
  4. (18)ROS学习-TF坐标变换之静态坐标变换
  5. 搜索技术【启发式搜索】 - 简介 A* 算法 IDA*算法
  6. tensorflow中的ops(或者说op)的理解
  7. Spring 实战最新版中文版
  8. Linux 内核源码中likely()和unlikely()
  9. android浏览器和iPhone浏览器
  10. Oracle数据库服务器端和客服端的安装