从上世纪 60 年代个人电脑出现到现在,数字世界已经深入到我们生活的点点滴滴,从微小 “数字细胞” 到庞大概念的 “元宇宙”。ChatGPT 的火热也再次我们感受到强大的数字力量,甚至很多人都在思考如何改变才能避免工作上被替代。但是在数字世界中,我们是否拥有自己的数据?您是否面对过个人数据丢失、个人隐私泄漏、数字生活成本增长、依赖平台、被平台 “杀熟” 等各种问题呢?个人在数字世界中的地位会是怎样呢?

我们将依次通过三篇文章 《迷雾》、《探索》、《家园》来分析个人数据的现状和核心问题、剖析当前的技术和设计、探究解决之道和未来发展。

今天是第一篇《迷雾》。将通过重温过去 40 年的快速发展,思考我们如何失去了个人数据的所有权,以及我们面对的问题和解决方向。

目录

  • 什么是个人数据
  • 我们面对的变化
    • 20 世纪末的个人电脑时代
    • 互联网兴起之初
    • 移动互联网的浪潮
    • 社交的风起云涌
    • AI 的汹涌澎湃
  • 我们面对的问题和往何处走

什么是个人数据

教科文组织关于个人数据的定义1:个人数据是与个人(数据主体)有关的任何信息。这个定义是一个狭义定义,关注点在于会有个人标识的信息,比如姓名、邮寄地址、电子邮件地址、电话号码和医疗记录。

我们要讨论的个人数据是指个人拥有的电子数据,比如个人创建的笔记、文档、通讯录、日历等,个人拍摄、录制的家庭照片、视频、录音等,个人购买的应用软件、电子书、音乐等。

就像真实世界里,我们的家庭相册、购买的家具、书籍放在我们自己的家里一样,数字世界的家也应该是个人拥有的保护个人数据的一个空间。

我们面对的变化

过去 40 年的发展,个人数据也快速增长,我们的生活在全方位的数字化。

20 世纪末的个人电脑时代

不知道还有多少人记得 1.44MB 容量的软盘、DOS 命令以及五笔口诀的时光,那个时光是我最初的 PC 电脑的记忆2,有这个记忆的朋友们估计都已经度过了 “35 岁” 的门槛。

在那个时代里,我们通过软盘、光盘、优盘以及移动硬盘来回折腾着自己的文件和数据,在 Windows、Linux 系统中折腾各种软件工具。虽然现在看来可能有些 “低效”,但那时候每个人的数据主要是存在个人电脑中,软件程序只是我们处理数据的工具。

在那个 “旧” 时代,我们的数据是属于我们自己的。

互联网兴起之初

来到 21 世纪初,以 Yahoo(雅虎)、Google(谷歌)为代表的互联网浪潮开启了属于门户网站和搜索引擎的数字时代,也伴随着电子邮箱、办公软件、电子竞技游戏等各种数字产品的发展。不仅魔兽世界是在 2004 年第一次发版,Gmail 也是 2004 年正式发布。相比于目前个人数据开始迈向的 TB 级别,1GB 现在看是一个很小的空间,但作为第一家提供 GB 级空间的 Gmail 很快成为最受欢迎的一个。现在还记得那时候朋友们早期找推荐获得 Gmail 账号的兴奋3,尽管也伴随着对于个人数据挖掘分析的争议4

以流量、广告为基础的互联网盈利模式也正式形成,直到如今这也是数字世界中最主要的盈利模式,这也决定了对于个人数据的挖掘是数字平台本质驱动的诉求。

移动互联网的浪潮

发布在 2007 年的 iPhone 苹果手机则开启了移动数字生活的浪潮,让数字世界触角深入到我们生活的各个方面。看着在上班路上乘坐地铁时的 “低头族”,我们很难想象没有手机的生活是怎样的。照片、视频、通讯录、笔记、文件等个人数据通过手机这个媒介在各种平台中流转。我们对随时随地使用数据的诉求,也使得以 Dropbox 为代表的网盘和以 iCloud 为代表的个人云产品快速发展。

然而我们会发现个人数据已经分裂在各种不同的平台上。更可怕的是,我们开始依赖平台以及对应的生态,如果不克服损失和困难,很难脱离某一个平台。这种依赖会使得用户长期每年为某一个平台或公司的发展贡献一份 “力量”,难以脱离。

社交的风起云涌

从 2003 年的 Myspace 和 2004 年创建的 Facebook 开始,以 Facebook(脸书)、Instagram、Tiktok(抖音)、微信(WeChat)为代表的社交互联网的浪潮也在风起云涌。社交是人类文明发展的基础活动,数字化社交极大的提高了人们之间的交流沟通的效率。

但同时,数字社交产品的发展也让我们进一步依赖平台。当平台上某个账号无法使用了,我们会发现数字世界中这个用户就成为了零5。一方面在现在的社交平台中,账号作为用户在数据世界的标识就是属于平台的,脱离平台账号就没有意义了。另一方面,用户之间的好友关系、用户在平台上的数据也都从属于平台。这种依赖附属关系,使得如果我们不努力改变,每个人都可能成为了数字世界的 “奴隶”。

AI 的汹涌澎湃

从 2015 年 AlphaGo 到 2022 年的 ChatGPT,这几年的 AI 浪潮,让我们感受到了数字力量的强大。我相信 AI 会越来越强大,对世界的发展会起到越来越重要的作用。

但同时,也让人担心 “黑客帝国” 的情景离我们并不远,“AI 教父” 杰弗里・辛顿也有如此担忧6。最开始担心这个问题是一次几年前的打车经历,在车上司机跟我诉说着对于平台自动派单的吐槽和无奈。在自动派单模式下,是平台根据 AI 算法安排司机做哪一个单子。虽然司机可以选择不去,但是次数多了也会影响未来的收入。所以,司机是在平台(AI)的指挥下做事情,在为平台打工,并且依赖平台。AI 会越来越强大,那么这种模式很可能会发展到越来越多的行业中,最终让人担心会走向黑客帝国中的 “人成为矩阵的能源来源” 的结果。

面对 AI,个人拥有自己的数据更为重要。

我们面对的问题和往何处走

从互联网、移动、社交到 AI 浪潮,我们的时代有了深刻的变化,但同时个人数据的所有权也在逐步失去,我们面对着越来越多的问题,包括个人数据丢失、个人隐私泄漏、数字生活成本增长、依赖平台、被平台 “杀熟” 等问题。

上述问题的核心是数据的所有权,只有让个人数据掌握在人的手上而不是平台之上,才能避免数字世界中人成为 “数字矿产”,才能避免黑客帝国成为现实。

我们拥有自己的数据的三个基本问题是:

  1. 账号是否属于个人:个人账号应当由个人拥有,而不是属于互联网平台。
  2. 数据是否属于个人:个人数据应该由个人拥有,而不是属于互联网平台或第三方机构。
  3. 数据使用是否依赖平台:个人数据应该由个人主导使用,而不是需要依赖互联网平台或第三方机构。

当且仅当 “账号完全属于个人”、“数据完全属于个人”、“个人对数据的使用不依赖平台” 这三个条件都达成才能说个人是拥有自己的数据的,只有这样我们才能在数字世界中有主动权,让数字世界成为由人主导的可持续发展的社会。

我们很高兴的看到无论是国家的立法监管7,还是公众隐私保护意识的提高,都在促进这个问题得到更多的关注。

同时我们也看到,近些年一些技术的发展和探索也在向这个方向努力。我们将在第二篇文章《探索》中分析当前相关技术的发展以及 3 个基本问题解决的前景,欢迎关注。

欢迎加入讨论组 https://slack.ao.space 围绕这个话题展开讨论。

参考链接


  1. 教科文组织个人数据保护和隐私原则 ↩︎

  2. 个人电脑 - 维基百科 ↩︎

  3. Google opens Gmail to all - 互联网存档 ↩︎

  4. Gmail does scan all emails, new Google terms clarify ↩︎

  5. Trump’s banishment from Facebook and Twitter: A timeline. ↩︎

  6. ‘Godfather of AI’ Geoffrey Hinton quits Google and warns over dangers of misinformation ↩︎

  7. 表决通过!个人信息安全有了专门法律保护 ↩︎

迷雾:我们是否拥有自己的数据?相关推荐

  1. 谁拥有你的数据?谁又动了你的数据?

    谁能拥有你的数据? 很多时候我们不会去阅读服务协议,却习惯于签署.通过它们.但现在,这越来越成为一个民生问题了.像 UPS 和亚马逊这样的物流公司,能通过他们先进的监控网络,对员工进行微观管理.而国际 ...

  2. 最新数据显示:2025年中国将拥有世界最大数据圈

    国际数据公司(IDC)2月21日发布的报告预测,中国数据圈在2025年增至48.6ZB字节,占全球27.8%,成为最大数据圈. IDC昨天发布了<数字化世界-从边缘到核心>和<IDC ...

  3. 个人永久性免费-Excel催化剂功能第98波-零代码零距离轻松接触并拥有金融大数据...

    数据产生价值的一个最突出的领域-金融领域,股票.证券.上市公司财务报表等,多少人在其中发掘出宝贵的数据价值. 今天Excel催化剂联合Tushare金融大数据平台,让这一切的数据都能成为你我普通人零代 ...

  4. 虚拟服务器怎么突破磁盘2t,创建一个拥有超过2T数据盘的Windows虚拟机

    最近一个项目中,尝试发放一个Windows 虚拟机,要求10T的数据盘.但是给虚拟机挂载10T的数据盘之后,操作系统中只能读出2T来.搜索了下这个问题之后发现这个问题不只是虚拟机有此问题,在物理机上也 ...

  5. 想拥有优秀的数据分析师思维,你还需要补足这一点

    一名数据分析师的日常工作流是怎样的? 「数据分析师」这个职位,不同的公司,不同的行业,对于它的理解,以及它覆盖的工作范围不太一样.在有些传统行业,数据分析师工作重点是「做行业报告」等;在阿里巴巴等大型 ...

  6. 成功的机器学习应用不是拥有最好的算法,而是拥有最多的数据

    机器学习的方法 1.回归算法 2.神经网络 3.svm(支持向量机) 4.聚类算法 5.降维算法 6.推荐算法 7.其它(高斯判别,朴素贝叶斯,决策树等等) 按照训练的数据有无标签,可以将上面算法分为 ...

  7. 计算机检索的优点,专利检索与分析系统拥有哪些优势?

    专利检索与分析系统拥有哪些优势?现在很多朋友都在了解专利检索与分析系统又有哪些优势,因为他们需要使用这些系统,不少朋友都会利用业余时间搞各种发明专利,并申请发明专利,在申请之前,人们就需要对专利进行检 ...

  8. CIO时代学院院长姚乐:传统行业遇上大数据 拥抱智能化未来

    近几年,互联网行业发展突飞猛进,"大数据"技术瞬间变得炙手可热,当然,对于发展中的大数据技术而言,很多行业都不会错失良机.近日,CIO时代学院院长.中国新一代IT产业推进联盟秘书长 ...

  9. 深挖数据价值 阿里云栖开年大会报道

    本文讲的是深挖数据价值 阿里云栖开年大会报道[IT168 云计算]经历风雨,转身看到彩虹.在这个"化云为雨"的时节,造云大咖们角色扮演也逐步渐入佳境,或随需而动,或引领潮流.阿里云 ...

最新文章

  1. 登录抓包逆向分析学习笔记
  2. Cisco2620路由器的密码恢复和灾难性恢复
  3. 分形(Fractal)
  4. odoo10参考系列--QWeb
  5. Centos 查看系统硬件信息
  6. iOS UILabel字体设置
  7. 一篇文章,送给通信专业的学生
  8. 手机组态软件 APP监控台达PLC C#全套源代码
  9. 阿里矢量图标(字体图标)
  10. 地理入门-经纬度时区速成总结篇(转)
  11. kubernetes 非安全部署
  12. excel如何根据身份证批量提取员工年龄?
  13. 大兴机场临空区爆出大规划!
  14. 判断点是否在点组成的封闭区域内c++
  15. 【python教程】揭秘京东|淘宝秒杀抢购背后的黑幕,为什么你总抢不到商品?
  16. 北京大学可视化暑期学校Day1总结
  17. 2021-10-16设备管理与维修
  18. 四川师范大学Java期末_四川师范大学2008-2009第一学期常微分方程期末试题A英文版(含答案)精选.pdf...
  19. 云小课|MRS基础原理之MapReduce介绍
  20. Android正确的保活方案,不要掉进保活需求死循环陷进

热门文章

  1. 小狼毫输入法常用设置
  2. 随便画一个百分比堆积柱状图
  3. 丰田pcs可以关闭吗_百公里4个油的丰田省油王,标配就有自动驾驶,完胜朗逸...
  4. 神经网络结构图绘图软件,神经网络示意图怎么画
  5. 高一英语计算机课文,高一英语上册-电子课本
  6. 浙江工商大学计算机考研调剂,浙江工商大学计算机学院2013考研调剂信息
  7. 云控系统+海外抖音TikTok直播公会,让直播变得更加容易
  8. 游戏的本质[转自网易]
  9. 传聚划算规则调整将取消多项收费 已有商家收到通知
  10. 项目管理的是做什么的?