这几天很多人在讨论Windows10源代码泄露的事,也有不少朋友询问老雷:“是真的么?”“听说泄露了32T啊?”“哪里可以下载?”……难以一一回答,正好在返沪的高铁上有些空闲时间,于是写篇短文吧。先简要回到前两个问题:确实是真的,但远远没有32T那么多。

要理解这起事件,应该从一个名叫BetaArchive的网站(简称BA)说起。用BA网站首页上的话来说,这个网站是为Beta软件收集者建立的技术社区{The community for beta collectors}。在老雷看来,这个网站的主要功能有两个:一是收集(collect)保存(archive)各种软件的Beta版本和所谓的废弃件(abandonware)(BetaArchive is one of the largest repositories of betas and abandonware on the Web.),二是以论坛形式为大家提供讨论空间。这两大功能是为了实现BA网站logo中的三个目标:collect(收集),learn(学习),preserve(保存)。

BA网站的老大名叫Andrew Whyman,在网站上的用户名就叫Andy(Andrew的昵称)。根据BA网站上的讨论记录,Andy本人应该也是从事软件技术的,经常在论坛里参与各种讨论,发帖总数有12323个。从他建立BA这个极具怀旧情节的网站来看,他应该也像老雷似的喜爱历史。从Andy本人的用户信息来看,他加入BA论坛的时间为2006年8月18日(Joined Fri Aug 18, 2006 11:47 am),据此可以比较准确地推测出BA网站的创建时间(根据BA网站wiki的介绍,确实是于2006年8月开放(It was opened in August 2006 by Andrew Whyman who goes by nickname "Andy" and is currently managed by Andy with the assistance from co-admin mrpijey and the moderators. ))。Andy的位置是英格兰西北部的默西塞德郡(Merseyside, United Kingdom),他喜爱的操作系统(Favourite OS)是Microsoft Windows 7 Ultimate x64。

在泄露事件发生前,BA网站并不怎么著名,可能只有一些特别钟情操作系统底层的“技术控”才知道。

越深入了解BA网站,越觉得它很像是国内的驱动开发网。读了一些Andy的发帖后,不由得就想起了驱网的老马:胖乎乎,笑呵呵,无比勤奋(网站的里里外外忙不停),无比执着(坚持坚持再坚持,任外界风起云涌,但自己的网站十年不变(是耶非耶?))......

为了可以收集更多材料,BA网站鼓励用户上传文件,并且有奖励机制,这也和老马的驱网很像。所谓Beta,就是软件的公开测试版本,具有两大特征:一是公开性(不像是Alpha等内部测试版本),二是时效性(正式版本出来后,通常就不能使用或者没有使用价值了)。因此,BA网站收集Beta软件这个主业应该是合法的。截止本文写作时间,BA网站共搜集了39000多个发布,总大小超过70TB(Archive Stats: 70.58TB, 39,053 releases)。

时代在不断变化,软件产业也在不断变化,软件的开发测试过程和发布形式也在变化。以Windows为例,在Windows 10之前,微软会在推出正式版本前公开测试用的Beta版本。但是从Windows 10开始,完全公开的Beta版本没有了,取而代之的是所谓的Windows Insider Program(为了行文方便,简称WIP)。简单说,WIP要求用户要先注册登记,然后才可以到指定网站下载测试版本的Windows 10、调试符号、以及其它文档或工具。另外,WIP是有保密条款的,用户可以使用和测试从WIP网站下载的非正式版本,但却不可以分享给别人和扩散。因此,从法律上说,WIP版本和Beta版本是本质区别的。尽管如此,仍有人把WIP版本当作Beta版本,向BA网站上传,或许是为了获取积分吧。从WIP网站上还可以下载调试符号,按说也是不可以随便扩散的,但很多人不管不顾。长此以往,大家都见怪不怪了。WIP是从2014年开始的,几年过去了,向BA上传的WIP文件应该以TB记了吧。

冰冻三尺非一日之寒,事故就在大家的司空见惯中发生了。在6月19日这一天,一个很敏感的文件包混杂在其它一些本来已经司空见惯的WIP文件中,被上传到了BA网站的FTP站点,进入了公众视野。

BA网站有个传统,每次上传文件后,都会发一个上传记录到论坛上的一个专用帖子里。十几年下来,这个帖子已经有400多条记录,分成20页。

在6月19日的上传记录中,可以看到那个包含源代码的敏感文件包——Shared Source Kit(简称SSK,稍后细说),以及与它一起上传的其它文件。

起初并没有太多人注意到这次上传。但熟悉Windows的专业用户一定还是看到了站点里新上传的宝贝。但其中的多数人或许都只是悄悄地下载下来就完事了,仿佛在一堆乱沙中,拣到了一颗钻石……

日子一天天过去,越来越多的人看到了乱沙中的宝贝。其中还包括一个身份特殊的人,他的名字叫Chris Williams,是技术媒体The Register的加州分部总编辑(Chris is The Register's US bureau chief based in San Francisco, California. He writes about semiconductor chips and software engineering.)。Chris的工作便是发现半导体芯片和软件工程领域的猛料,并将其公之于众。两个月之前,他曾经就INTEL芯片的AMT漏洞大作文章:Red alert! Intel patches remote execution hole that's been hidden in chips since 2010。

不清楚Chris是从什么渠道得知了BA网站上埋藏的“宝贝”,但是很清楚的是,他最先意识到了这件事的新闻价值。于是在6月23日晚上,一个爆炸性的新闻出现了,标题为:

Heaps of Windows 10 internal builds, private source code leak online

(成堆的Windows 10内部版本和私有源代码被泄露到互联网)

文章的发表时间为 23 Jun 2017 at 20:09,星期五晚上8点多。熟悉媒体的都知道,这个时间是在互联网时代中发布消息的黄金时间,应该是Chris是精心选择的吧。

链接为:

https://www.theregister.co.uk/2017/06/23/windows_10_leak/

The Register创立于1994年,总部在英国伦敦,是一家颇有影响力的技术媒体,它的报道一出,立刻在世界范围内掀起了轩然大波。几乎所有大大小小的技术媒体都争相报道这一事件,有的媒体没有搞清楚问题就发表文章,其中不乏有人添油加醋,夸大事实,甚至以讹传讹。最大的一个误传就是关于泄露代码的数量,很多媒体误传是32TB,比如国内还有点名气的一个安全论坛的文章专题就是《32TB的Windows 10核心源代码泄露》。真正了解Windows的人知道,Windows 10的完整源代码也不足1TB,应该在数GB级别。

那么32TB是哪里来的呢?应该是来自The Register报道中的下面一段话:

The data – some 32TB of official and non-public installation images and software blueprints that compress down to 8TB – were uploaded to betaarchive.com, the latest load of files provided just earlier this week.

解读一下这段话,作者表达了几层意思:

  • 泄露数据的数量,大约32TB,压缩后是8TB

  • 泄露数据的性质:微软官方的,非公开的安装镜像和软件蓝图

  • 数据流向:被上传到BA网站

  • 上传时间:最近一次上传就在本周早些时候

从“最近一次上传”这句话来看,作者说的32TB应该是几年来累计上传的WIP文件总和。总和为32TB,压缩后为8TB,好清晰的数据,这样的数据一定是来自对BA极其熟悉的人。

Chris的文章一出,消息迅速流传,BA网站立刻出名了,这肯定惊动了BA网站的老大Andy,他一定是惊喜交加。喜的是多年苦心经营的小网站一下子火了,几个小时里的访问量或许已经超过了平时一年的;惊的是这样泄露事件会不会给自己带来麻烦。

Andy紧急行动,先是删除了涉事的包含源代码的SSK包,然后连夜起草声明,在伦敦当地时间周六凌晨1点发表在BA站点上(https://www.betaarchive.com/forum/viewtopic.php?f=1&t=37283)。在这份声明中,Andy的第一句话是The Register article ... s_10_leak/ has got BetaArchive a fair amount of attention this evening. 第二句话便提到泄露数据的数量,并予以否定。

The folder itself was 1.2GB in size, contained 12 releases each being 100MB. This is far from the claimed “32TB” as stated in The Register’s article, and cannot possibly cover “core source code” as it would be simply too small, not to mention it is against our rules to store such data.

Andy说涉事的目录为1.2GB,这是有些媒体称泄露1.2GB源代码的依据,但也是错误的,因为1.2GB里面仍然大部分都是二进制的安装文件,源代码只是其中一小部分。

短文已经不短了,考虑到还有很多内容要写,所以分成多个部分吧,未完待续。

Windows 10源代码泄露风波(上)相关推荐

  1. windows服务器版本信息泄露,震惊!微软32TB Windows 10源代码在网上被泄露

    Windows 10 凤凰科技讯 据The Register北京时间6月24日报道,多个微软内部Windows操作系统版本及内核源代码泄露到网上. 这些数据--32TB的非公开官方安装映像和软件蓝图设 ...

  2. Windows XP源代码泄露,外媒从中发现隐藏Mac主题

    晓查 发自 凹非寺  量子位 报道 | 公众号 QbitAI △ Windows XP系统默认壁纸 本周,微软的Windows XP和Windows Server 2003系统源代码在网上泄漏.这两大 ...

  3. C 主导、C++与 C# 为辅,揭秘 Windows 10 源代码!

    作者 | h4cd 本文经授权转载自开源中国(ID:oschina2013) Windows 操作系统本身是不开源的,但是近日微软内核工程师 Axel Rietschin 发表了一篇博客,带大家一窥了 ...

  4. win10无法打开匿名级安全令牌_Printer Spoofer:在Windows 10及Server 2019上滥用Impersonation权限...

    0x00 前言 过去几年中诞生了不少工具,如RottenPotato.RottenPotatoNG或者Juicy Potato等,这些工具能够利用Windows系统中的模拟(Impersonation ...

  5. exe msdt 无法上网_欲哭无泪 Windows 10无线网连不上怎么办

    在使用Windows 10上网时,也许你会遇到无法连接无线网的怪现象,网通列表中明明可以可看到网络名称,但连接时显示无法连接此网络.这个问题发生的原因可能多方面的,要针对具体情况来应对.如果你遇到这一 ...

  6. windows更改服务名称_如何在Windows 10的登录屏幕上更改名称

    windows更改服务名称 Whenever you sign in to Windows 10, your full name appears above the password entry. Y ...

  7. Windows XP 源代码泄露,微软终于回应了~

    点击上方蓝色"程序猿DD",选择"设为星标" 回复"资源"获取独家整理的学习资料! 来源:网络整理 在 Windows 7 都已经停止支持的 ...

  8. 突发!Windows XP源代码泄露

    来源:网络整理 在Windows 7都已经停止支持的0202年,Windows XP仍占据了不小的市场份额,是装机人手中的"香饽饽".不过今天,互an联quan网圈再次给了XP沉重 ...

  9. 在Windows 10/8/7电脑上无法复制粘贴文件的解决方法

    某一天 身为小白的我发现电脑无法粘贴任何东西了(不限于某应用),重启之后仍然不好用,慌的一匹,你能想象到,现在的我是多么离不开复制粘贴么吗? 简直想在电脑上浇点水让他冷静一下,好在我足够冷静制止了自己 ...

最新文章

  1. R程序设计中的IF、IFELSE、SWITCH
  2. 文化氛围对新人培养新人的影响
  3. UVA - 817According to Bartjens
  4. 第三次学JAVA再学不好就吃翔(part55)--StringBuffer类的删除功能
  5. JavaScript中的正则
  6. 基于BERT的ASR纠错
  7. mysql force Index 强制索引[转]
  8. python实现xml数据解析处理
  9. android java项目源码_Android项目源码本站第三个知乎app项目
  10. 无线网络 EAP 认证
  11. 骁龙660鸿蒙系统,骁龙660 AIE是什么意思?高通骁龙660 AIE与660的区别
  12. S4 HANA 1809 FPS03 Standard装机总结(刘欣2019.11.7)
  13. 多视图信息瓶颈表征学习
  14. 台式计算机入门基础知识,电脑基础知识:新手入门最全电脑知识干货
  15. css高级应用,如何实现多行省略
  16. 释放英特尔锐炫™显卡潜能:性能升级、定价更新
  17. 我是如何在一晚上拿到阿里巴巴offer的?
  18. Word 如何删除页面中的回车符 / 段落标记
  19. 先锋机器人Pioneer3 DX使用
  20. 班章管家:理财产品哪个好一些?从以下几个方面比较

热门文章

  1. C中格式化输出%lf,输出为保留6位小数的数。
  2. DP地狱训练 挤牛奶
  3. 使用Android Studio写一个发短信的小案例
  4. (转)学习linux的几本书
  5. 如何强行卸载电脑上面的恶心软件
  6. 鲁大师Q1季度电脑硬件报告:intel 12代酷睿笔记本霸榜,显卡小幅降价
  7. 65Z5芯片,65Z5三极管,稳压输出3V的IC资料
  8. 人工智能新动态:“上海马桥人工智能创新试验区”方案亮相
  9. Linux tomcat应用验证码出不来问题解决方法
  10. 【不得不看】aiwi游戏电脑安装步骤