【数据猿导读】Facebook 泄露5000万用户数据的事情余波未消,李彦宏一句“中国人愿意用隐私换便利”再掀波澜,近日,支付宝因三项违规被罚18万其中一条也是“个人金融信息使用不当”。为何数据泄露事件屡发不止?大数据技术与个人隐私之间的矛盾真的就不可调和吗?大数据时代我们真的都是透明人吗?

记者 | 小北

官网 | www.datayuan.cn

微信公众号ID | datayuancn

自大数据技术兴起之始,关于数据隐私的争论就从未平息。

Facebook 泄露5000万用户数据的事情余波未消,李彦宏一句“中国人愿意用隐私换便利”再掀波澜,近日,支付宝因三项违规被罚18万其中一条也是“个人金融信息使用不当”。

为何数据泄露事件屡发不止?大数据技术与个人隐私之间的矛盾真的就不可调和吗?大数据时代我们真的都是透明人吗?

其实不然。

 隐私换便利没有错,前提是知情与允许

李彦宏一句“中国人愿意用隐私换便利”在媒体的推波助澜下被万众谴责,然而大家只知其一,不知其二。李彦宏这句话的下一句是:“当然我们也要遵循一些原则,如果这个数据能让用户受益,他们又愿意给我们用,我们才会去使用它。而这个原则带入到用户的角度,那就是要在用户知情、允许的前提下,变向地用隐私换取服务。”

当局部变得完整,细细品味,其实此言不无道理。

因为我们每个人,都曾用“隐私换便利”。比如,为了吃到外卖,必须把自己的联系方式与家庭住址让渡出去;为了打车,必须把你所在的实时位置让渡出去;为了看病,必须把自己的病历信息让渡出去;为了看自己喜欢的资讯,必须把自己的浏览记录让渡出去……

这些行为之所以不违法,是因为用户知情,并且允许。而Facebook利用“性格测试”的幌子,让27万用户在不知情的前提下提交了自己身份信息和社交信息,并通过这27万用户获取了他们超过5000万的社交好友资料,最后转交给剑桥分析。在这个过程中,所有用户都不知情,更谈不上允许,并且还存在诱导欺诈行为。如果Facebook从最开始就明确告知用户收集信息的目的,并经用户同意后再行处理,那么扎克伯格就不用亲赴国会面对众人质询了。

知情与允许是企业获取用户数据的前提,但让用户知情并心甘情愿允许却并非易事。所谓上有政策,下有对策,各大企业为了获取这宝贵的“允许”可谓花样百出,各显神通。虽然此次支付宝个人金融信息使用不当的具体细节未披露,但去年年底支付宝账单默认勾选“同意芝麻服务协议”的“愚蠢行为”想必大家还记忆犹新,更别提普天之下有多少APP实行“强制允许”——不允许无法使用。

难道要想获得便利、高效的互联网服务,我们真的必须穿上“皇帝的新装”,做个没有隐私的“透明人”吗?

其实不然,江湖混战,还需遵“道”。此“道”为法。目前,我国关于数据隐私的立法,已经初步启动。

多层立法模式确保剑柄握在用户自己手里

大数据立法的前提在于厘清隐私保护的边界以及个人数据的归属权。

从网络实践来看,网络隐私包括用户的身份信息和网络行为数据。网络身份信息涵盖用户实名身份信息、注册信息和虚拟地址信息等足以精准到个人信息的数据,在法律性质上属于传统隐私权涵盖范围。至于网络行为产生的数据信息,因直接或间接都无法精确到自然人,所以其法律性质更像是知识产权。

2017年6月1日起正式实施的《网络安全法》第76条明确规定了法律保护的个人信息范围,即“单独或者与其他信息结合识别自然人个人身份的各种信息”。除此之外的数据信息即行为数据,属于大数据性质,不在隐私权保护体系范围之内。

根据这一法律逻辑,我国初步建立起了对隐私保护的三层立法模式:

第一层,自然人的姓名、身份证件号码、电话号码等敏感的身份信息是法律保护最高等级,任何人触犯都将受到刑事法律最严格的处罚。这一点要求大数据企业未经用户允许不得采集、使用和处分具有可识别性的身份信息。

第二层,对于除个人身份信息之外的不可识别的数据信息,按照商业规则和惯例,以“合法性、正当性和必要性”的基本原则进行处理。这一点确保大数据企业即便在征求用户同意之后,也不得违反法律规定过度化使用不可识别的数据信息。支付宝此次被罚其中一条就是“个人金融信息收集不符合最少、必需原则”。

第三层是明确个人数据控制权。《网络安全法》明确规定数据控制权是人格权的重要基础性权利。Fackbook数据泄露事件正好强化了公众的数据保护意识,大数据企业应该从技术和制度两方面,保证用户充分享有对自己数据的知情权、退出权和控制权,确保剑柄握在用户手中。在此方面,欧盟曾推出“被遗忘权”,允许用户从搜索引擎结果页面中删除自己的名字或者相关历史事件。

大数据企业让数据懂你但不认识你

除了国家立法层面,大数据企业也应该遵守一定的规范,积极主动地保护用户隐私。

首先,大数据公司只能收集为我们提供特定服务所必需的特定数据。打车或外卖软件只能要求用户提供实时位置和电话号码,而不能收集用户的身份证号码等其他不相关信息,修图软件可以收集用户的图片信息而不能要求用户提供文章信息。

对于经用户允许收集来的信息,大数据企业也必须保证不能错用、滥用。除此之外,大数据企业也有责任保护用户隐私数据不为第三方窃取或滥用。比如我们的就诊信息被医药公司窃取,那么医院必须承担相应的责任。此次Facebook引起公愤,正是因为其数据被剑桥分析窃用,没有尽到保护的职责。

除了统一的使用规范,大数据公司还可通过数据脱敏的技术手段来保护个人隐私。数据脱敏是指对某些敏感信息通过脱敏规则进行数据的变形,实现敏感隐私数据的保护。即将用户的个人信息在企业内部以匿名化方式存储,比如淘宝可以在储存你的浏览记录时匿去个人身份信息,这样它就能在不侵犯你隐私的情况下给你推荐喜欢的商品,懂你,但不认识你。

“懂你,但不认识你。”这便是大数据发展与个人隐私之间的一个平衡点,是数据生命周期中的最好状态。

掌握着大量数据的企业,首先应该做的便是利用技术把握好这个平衡点,而非一心利用数据追求商业价值。只有突破了数据隐私保护的瓶颈,大数据企业才能迎来真正的春天。(文/小北)


4月26日-4月27日,AI in China 之智能制造-数据驱动产业变革-高峰论坛即将开始,期待我们的见面

大数据与个人隐私的平衡:懂你,但不认识你相关推荐

  1. 大数据面前无隐私 到底谁才是老大哥

    (原标题:大数据面前无隐私,到底谁才是老大哥) 最近,几家大型的互联网企业,都因为数据隐私过得都不太安生. 阿里系这边,旗下子公司支付宝被爆出在"年度账单"活动中,靠默认勾选套取用 ...

  2. 大数据时代的隐私保护:“被遗忘权”

    个人有权要求删除指向个人信息的链接,这是网民夺回网络空间的一大步吗? 注:欧洲的最高法院5月裁定,在特定情况下,个人有权要求删除指向个人信息的链接.这是欧洲法院法官的一小步,却是网民夺回网络空间的一大 ...

  3. 大数据时代的隐私保护

    互联网上产生的越来越多的个人数据,究竟应该如何处理?莫妮卡·莱温斯基自称是"互联网时代第一个受全球侮辱的人". 她是美国前总统比尔·克林顿"桃色新闻"事件的女主 ...

  4. 云小课|大数据时代的隐私利器-GaussDB(DWS)数据脱敏

    阅识风云是华为云信息大咖,擅长将复杂信息多元化呈现,其出品的一张图(云图说).深入浅出的博文(云小课)或短视频(云视厅)总有一款能让您快速上手华为云.更多精彩内容请单击此处. 摘要: 数据仓库服务Ga ...

  5. 2022年北京大数据技能大赛“隐私计算”赛道初赛完结!12强出炉

    10月14日,2022年北京大数据技能大赛"隐私计算"赛道初赛顺利结束,阶段性成果初现. 前情提要 | 速来!2022北京大数据技能大赛隐私计算赛道可以提交了! 2022年北京大数 ...

  6. 人力资源大数据公司_大数据与人力资源相结合,平衡透明度和隐私

    人力资源大数据公司 这对人力资源部门来说是一个激动人心的时刻-分析的使用可以预测地将围绕人力资源的对话和看法改变为一项功能. 大多数组织相信人员分析在使HR成为高级管理人员的战略合作伙伴方面可以发挥的 ...

  7. 大数据时代个人隐私危机亟待法律破解

    据铁路部门发布,今年2月8日,全国铁路发送旅客757.6万人次,同比增加69.3万人次,增长10.1%.这些数据,如果呈现在一张地图中,一定非常有趣. 今年春运期间,互联网上就出现了一张可以呈现国内春 ...

  8. 人民日报点名大数据时代信息隐私安全

    16年多起大学生电信诈骗曝显,山东徐玉玉案闻之落泪,而这背后,都是大数据信息共享的安全缺漏,生活在全面数字规范化的今天,个人隐私的形态和观念已经发生重大改变.如果说传统意义上,保险柜.房屋构成的物理空 ...

  9. 深度学习数据集中数据差异大_使用差异隐私来利用大数据并保留隐私

    深度学习数据集中数据差异大 The modern world runs on "big data," the massive data sets used by governmen ...

  10. 数据脱敏平台-大数据时代的隐私保护利器

    什么是数据脱敏 又称数据漂白.数据去隐私化或数据变形.是对核心业务数据中敏感的信息,进行变形.转换.混淆,使得对业务数据中的身份.组织等隐私敏感信息进行去除或掩盖,以保护数据能被合理.安全地利用. 数 ...

最新文章

  1. 网站本地测试安装流程
  2. TCP长连接和短连接
  3. #研发解决方案#基于Apriori算法的Nginx+Lua+ELK异常流量拦截方案
  4. 12)登录验证函数简单编写验证
  5. Linux--网络编程
  6. ARM 指令集 VS Thumb 指令集
  7. ctfshow-萌新-web8( 从删库到跑路)
  8. 使用Nginx架设高性能流媒体服务器
  9. 多变量频率统计——r
  10. VS2010中的sln,suo分别是什么含义
  11. Sublime Text3自定义主题
  12. java 方法重载 应用举例,Java中的方法重载应用
  13. 安装虚拟机步骤 详细
  14. 基于STM32F103C8T6与ESP8266的物联网智能温度采集与蓝牙OLED数字钟的设计与实现
  15. 国防科大计算机学院贾焰,国防科大教师中院士顶级选手
  16. 放纵如山倒,自律如抽丝
  17. 左手是永恒,右手是瞬间
  18. XTU OJ 1381表格
  19. 第3.4节 泛善可陈的元组
  20. 【程序设计】日期和时间

热门文章

  1. 学习笔记61—兴趣阅读之经济学
  2. linux不可用于文件名的符号,Linux 文件名中包含特殊字符
  3. Python爬虫爬取LOL所有英雄皮肤
  4. 设计模式之七大设计原则详解
  5. Admob设置Android设备为测试设备(2020年5月7日亲测有效)
  6. 网络工程师下午考试试题专题专解
  7. weka,FP,priori
  8. 七大人脉宝典造亿万富翁
  9. 湖南张家界夫妻自助旅游攻略
  10. 计算机专业法语词汇,法语计算机及网络词汇(4)