什么是数据脱敏(Data Masking)?
任何关于算法、编程、AI行业知识或博客内容的问题,可以随时扫码关注公众号「图灵的猫」,加入”学习小组“,沙雕博主在线答疑~此外,公众号内还有更多AI、算法、编程和大数据知识分享,以及免费的SSR节点和学习资料。其他平台(知乎/B站)也是同名「图灵的猫」,不要迷路哦~
一、什么是数据脱敏?
数据脱敏(Data Masking),又称数据漂白、数据去隐私化或数据变形。
百度百科对数据脱敏的定义为:指对某些敏感信息通过脱敏规则进行数据的变形,实现敏感隐私数据的可靠保护。在涉及客户安全数据或者一些商业性敏感数据的情况下,在不违反系统规则条件下,对真实数据进行改造并提供测试使用,如身份证号、手机号、卡号、客户号等个人信息都需要进行数据脱敏。
生活中不乏数据脱敏的例子,比如我们最常见的火车票、电商收货人地址都会对敏感信息做处理,甚至女同志较熟悉的美颜、有些视频中的马赛克都属于脱敏。
二、为什么要进行数据脱敏?
上面说到,在“涉及客户安全数据或者一些商业性敏感数据的情况下”对数据进行改造,说明我们要进行改造的数据是涉及到用户或者企业数据的安全,进行数据脱敏其实就是对这些数据进行加密,防止泄露。
对于脱敏的程度,一般来说只要处理到无法推断原有的信息,不会造成信息泄露即可,如果修改过多,容易导致丢失数据原有特性。因此,在实际操作中,需要根据实际场景来选择适当的脱敏规则。改姓名,身份证号,地址,手机号,电话号码等几个客户相关字段。
三、如何实现数据脱敏
按照脱敏规则,可以分为可恢复性脱敏和不可恢复性脱敏。可恢复性脱敏就是数据经过脱敏规则的转化后,还再次可以经过某些处理还原出原来的数据,相反,数据经过不可恢复性脱敏之后,将无法还原到原来的样子,可以把二者分别看做可逆加密和不可逆加密。
我们目前遇到的场景是日志脱敏,即在把日志中的密码,甚至姓名、身份证号等信息都进行脱敏处理。
脱敏前:
脱敏后:
如上图,仔细分析会发现,打日志之前,获得脱敏的数据就两个步骤:【拿到要输入的数据(user实体)】→【进行序列化】,所以要进行数据脱敏可以考虑在这两个步骤上进行实现。第一个方法就是在序列化实体之前先把需要脱敏的字段进行处理,之后正常序列化;第二个方法就是在实体序列化的时候,对要脱敏的字段进行处理。
什么是数据脱敏(Data Masking)?相关推荐
- 数据脱敏 Data Masking
一. 数据脱敏是什么? 数据脱敏顾名思义就是对敏感数据进行变形处理,其目的是保护隐私数据等信息的安全,例如机构和企业收集的个人身份信息.手机号码.银行卡信息等敏感数据.数据脱敏从技术上可以分为静态数据 ...
- 云小课|大数据时代的隐私利器-GaussDB(DWS)数据脱敏
阅识风云是华为云信息大咖,擅长将复杂信息多元化呈现,其出品的一张图(云图说).深入浅出的博文(云小课)或短视频(云视厅)总有一款能让您快速上手华为云.更多精彩内容请单击此处. 摘要: 数据仓库服务Ga ...
- 数据脱敏python
最近在对数据做脱敏的事情,第一次接触这方面的,所以将自己的做法记录了下来,希望对大家有所帮助,仅是自己的一点拙见. 1.数据脱敏定义 数据脱敏(Data Masking),又称数据混淆.数据漂白.数据 ...
- 数据脱敏——什么是数据脱敏
一.什么是数据脱敏? 数据脱敏(Data Masking),又称数据漂白.数据去隐私化或数据变形. 百度百科对数据脱敏的定义为:指对某些敏感信息通过脱敏规则进行数据的变形,实现敏感隐私数据的可靠保护. ...
- 数据脱敏(Data Masking)- 模块功能设计
数据脱敏(Data Masking)- 模块功能设计 脱敏算法管理模块 算法类型取决于后台定制的算法类,表数据手动维护即可. 算法列表展示 算法维护-可根据程序提供的算法类型进行自定义算法. 算法删除 ...
- 数据脱敏(Data Masking)学习
数据脱敏(Data Masking) 数据脱敏也叫数据的去隐私化,在给定脱敏规则和策略的情况下,对敏感数据比如 手机号.银行卡号 等信息,进行转换或者修改的一种技术手段,防止敏感数据直接在不可靠的环境 ...
- Azure SQL Database (23) Azure SQL Database Dynamic Data Masking动态数据掩码
<Windows Azure Platform 系列文章目录> 我们在使用关系型数据的时候,有时候希望: - 管理员admin,可以查看到所有的数据 - 普通用户,某些敏感字段,比如信用卡 ...
- SQL Server 动态数据掩藏(Dynamic Data Masking)探索和实施
动态数据掩藏(DDM) 是SQL Server 2016 CTP 2.1引入的新功能 数据库加密技术本质上改变了数据存储结构,而DDM只是在返回客户端的时候对数据进行隐藏.sysadmin的成员登陆账 ...
- 数据脱敏的 6 种方案
一.什么是数据脱敏 英文全称:Data Masking . 先来看看什么是数据脱敏?数据脱敏也叫数据的去隐私化,在我们给定脱敏规则和策略的情况下,对敏感数据比如 手机号.银行卡号 等信息,进行转换或者 ...
- 数据脱敏:数仓安全隐私保护见真招儿
本文分享自华为云社区<GaussDB(DWS)安全:隐私保护现真招儿--数据脱敏>,原文作者:wo华哒哒. 引言 大数据时代的到来,颠覆了传统业态的运作模式,激发出新的生产潜能.数据成为重 ...
最新文章
- 用mendeley在word中插入文献_Mendeley在Word添加工具栏和插入和删除文献的方法 | 科研动力...
- nfc reader 卡密_红外NFC+50倍变焦,一款被严重低估的王牌?
- python知网查重_用Python写了个检测抄袭/文章去重算法(nshash)
- Android 倒计时——Timer和CountDownTimer的使用,实现启动,暂停,继续,重复,重设时长以及启动service后台倒计时
- 科学家风采|郑纬民:任中国计算机学会理事长四年的三点回忆
- easyui上传文件 jsp+js+controller
- 超大规模NLP模型升级,来智源大会见证世界记录的刷新
- wcf中如何Host多个WCF服务?
- win7用html做桌面,win7系统怎么制作主题桌面 win7系统制作主题桌面方法
- 微信公众号网页授权流程
- SDUT—Python程序设计实验78(函数)
- SAP MM ME57 把PR转成PO
- Zabbix邮件告警配置
- 33MW太阳能厂动工 日本福岛开启复兴之路
- http协议解决粘包拆包半包 的编码解码过程、 以及netty 使用http协议的原理
- 实验五、UML动态建模之状态图分析与设计
- NLP-生成模型-2017-PGNet:Seq2Seq+Attention+Coverage+Copy【Coverage解决解码端重复解码问题;Copy机制解决解码端OOV问题】【抽取式+生成式】
- python reduce
- 21、conda下载,安装,卸载
- 使用Selenium来爬取网页内容