一、数据匿名化(Data anonymization)

许多组织试图保护自己免受个人信息意外泄露的一种方式是,在将数据集放在云端或另一个服务提供商那里之前,从数据集中删除所有识别信息。去除身份识别是指通过数据集,删除可能具有个人身份的数据的过程。

例如,我们肯定希望删除姓名、身份证和其他明显的识别信息。然而,简单的数据去标识化往往不足以完全保护信息。其原因是,我们经常可以将看似无害的字段结合起来,以唯一地识别一个人。卡内基梅隆大学的一项研究分析了去识别数据集中通常保留的三个字段:邮政编码(在美国会更为具体)、出生日期和性别。

我们知道,这些字段中的任何一个单独使用都不能识别某人。卡内基梅隆大学的研究发现,这三个元素加在一起可以唯一地识别美国87%的人。这对我们来说意味着,我们需要更谨慎地保护数据,而不是简单地删除明显的识别信息。我们不只是去掉数据的身份,而是要将数据匿名化,使别人几乎不可能弄清个人的身份。

HIPAA标准包括一个严格的数据匿名化过程,在分析界被广泛接受。它提供了两种清除数据集的途径。

  1. 首先,我们可以让统计学家分析我们的数据集,并验证它非常不可能披露个人的身份。这个途径需要接触到专业的统计人员,而且它确实包括意外泄露的可能性;
  2. 另外,我们也可以选择使用安全港(Safe Harbor)的方法,该方法要求从我们的数据集中剔除18个可能相互结合而暴露个人身份的数据元素。

二、数据模糊化(Data obfuscation)

从数据集中删除数据的另一种方法是将其转化为一种无法检索到原始信息的格式。这是一个叫做数据混淆的过程。而我们有几个工具可以帮助我们:

  1. 我们可以使用HASH函数将数据集中的一个值转化为一个HASH值,注意HASH值是不可逆的;
  2. 另一个的方法是标记化(Tokenization)。在标记化中,敏感值被替换为使用查找表的唯一标识符。例如,我们可以用一个随机生成的10位数字来替换一个广为人知的值,如学生的ID。然后,我们需要维护一个查询表,如果需要确定某人的身份,就可以将这些值转换回学生证。当然,如果我们使用这种方法,需要保持查询表的安全。因为这种标记化是可逆的,它通常被称为假名化(Pseudonymization)技术。
  3. 最后,在许多情况下,我们根本不需要重新识别数据。如果是这种情况,我们可以使用一种被称为屏蔽(masking) 的方法从文件中编辑数据。这只是将敏感信息替换成空白。例如,我们可以将身份证号码的所有数字替换为X。

整理资料来源:
https://www.linkedin.com/learning/paths/become-a-comptia-security-plus-certified-security-professional-sy0-601

Security+ 学习笔记56 增强隐私保护的技术相关推荐

  1. android 新浪财经截屏分享,[图]Android 12截图曝光:启用全新UI 增强隐私保护功能...

    原标题:[图]Android 12截图曝光:启用全新UI 增强隐私保护功能 来源:cnBeta.COM Android 12 有望在今年秋季上线,相关的开发者预览版和 Beta 版本有望在本月晚些时候 ...

  2. 【OS学习笔记】三十三 保护模式九:分页机制对应的汇编代码之---用户程序代码

    本片文章是以下两篇文章: [OS学习笔记]三十 保护模式九:段页式内存管理机制概述 [OS学习笔记]三十一 保护模式九:页目录.页表和页三者的关系详解 对应的用户程序汇编代码. ;代码清单16-2;文 ...

  3. 【OS学习笔记】三十 保护模式九:段页式内存管理机制概述

    上几篇文章学习了任务切换相关知识,如下: [OS学习笔记]二十六 保护模式八:任务门-任务切换 [OS学习笔记]二十七 保护模式八:任务切换的方法之----jmp与call的区别以及任务的中断嵌套 今 ...

  4. 【OS学习笔记】十六 保护模式四:进入保护模式与在保护模式下访问内存的汇编代码

    本文记录的是之前四篇文章所对应的汇编代码.四篇文章分别是: [OS学习笔记]十二 现代处理器的结构和特点 [OS学习笔记]十三 保护模式一:全局描述符表(GDT) [OS学习笔记]十四 保护模式二:段 ...

  5. 元宇宙的隐私保护:技术与监管

    内容概要 保护用户隐私和数据安全是元宇宙产业健康发展的重要前提条件.为了保护好隐私数据,元宇宙平台应能实现三个基本要求:数据的全生命周期安全可信.用户有能力自主控制数据.支持各方进行分布式协同治理. ...

  6. 【计算机网络学习笔记17】网络安全、加密技术、“Virtual Private Network”技术

    [计算机网络学习笔记17]网络安全.加密技术."Virtual Private Network"技术 一.网络安全概述 1.1 网络系统的安全目标: 1.可用性(Availabil ...

  7. 清华系创企RealAI:独家“隐私保护机器学习”技术,全球首款编译级产品

    原创:谭婧   以侵犯隐私的方式处理数据,已属非法行为,违法必究,犯罪分子,瑟瑟发抖. 但数据,作为人工智能(AI)的"石油",不能简单粗暴一刀切,如何加高数据安全的"围 ...

  8. 学习笔记:cache 和spring cache 技术(1)

    title: 学习笔记:cache 和spring cache 技术(1) author: Eric liu tags: [] categories: hexo 缓存是实际工作中非常常用的一种提高性能 ...

  9. APPCAN学习笔记003---原生开发与HTML5技术

    APPCAN学习笔记003---原生开发与HTML5技术 技术qq交流群:JavaDream:251572072 1.HTML5的优势:   HTML5强悍牢固的骨架   CSS3精致到每一个毛孔的皮 ...

  10. Android学习笔记---09_深入了解各种布局技术

    Android学习笔记---09_深入了解各种布局技术 09_深入了解各种布局技术

最新文章

  1. 基于pyBoard的进一步的一些测试实验,MC3008
  2. Facebook开源内存数据库Beringei,追求极致压缩率
  3. 秒杀 高并发 类型系统方案设计
  4. java web sqlmapapi,深入了解SQLMAP API
  5. 单链表输出最小值并逐个删除
  6. 【SpringBoot】Spring+Druid初级配置
  7. 互联网金融的普惠之道
  8. 中规中矩的CentOS7安装Python3.5
  9. MFC编辑框数据读写
  10. Flash之SM25QH128M、JFM25F32A读写操作FPGA Verilog实现
  11. 将直播链接放入微信公众号
  12. 煤化工专用阀门有哪些?
  13. C语言中字符型变量与整型变量的联系
  14. uniapp map 点聚合 聚合点样式修改
  15. 工具及方法 - 文件正在被使用,无法改名或删除怎么办
  16. [ARM入门]瑞萨单片机RA族开发环境搭建
  17. JQuery在线引用地址整理
  18. Windows桌面应用程序(1-2-4-7th) DPI和设备无关的像素
  19. 弧齿锥齿轮零件图_转载:格利森弧齿锥齿轮副的安装与调整
  20. PSP模拟器 JPcsp

热门文章

  1. 20191226_1_淘宝口红商品分析
  2. 10个高效的摸鱼神器,你错过几个?
  3. 8.6 归纳式迁移学习
  4. 数据库系统:NoSQL与SQL的区别
  5. 编辑距离Edit distance
  6. 下滑加载更多js_jquery实现移动端下拉加载更多
  7. 华数机器人编程语言_招新 | 海大最「酷」的科创团队,确定不来了解一下吗?...
  8. 含蓄:为彼此的交往留下余地 — 《别输在不会表达上》
  9. Flutter高级第5篇:官方推荐的状态管理库 provider 的使用
  10. 【报错】table burner has no column named USER (code 1): , while compiling: INSERT INTO burner(USER,YELL