人们常问,到底为什么要销毁数据呢?为什幺要销毁文件呢?销毁与数据中心运营有什么关系呢?

其原因听起来比较残酷。如果你是无名鼠辈,有一些人会关心你,他们把无数老百姓的数据凑成一个叫大数据的东西去兜售;如果你小有声望,会有一批人关心你的隐私生活和朋友圈,你的数据经贩卖后流入市场会成为人们茶余饭后的谈资;如果你是名人、知名公司或响当当的品牌,无数人都在盯着你,渴望你言行出轨,期待你被举报被陷害被曝光,你的这些不幸数据却是他们的自媒体的绝佳内容,是获得流量和粉丝的强大工具,是他们圈钱的秘密武器。

数据泄露的数量让人瞠目结舌

世界上每天产生多少数据呢? 2.5P比特。1P是一百万的三次方,90%的数据是最近这两年产生的。大部分数据源于数据中心的服务器,为什么这么说呢?你兢兢业业地经营着自己的社交媒体,文章和图像需要上传到平台的服务器上别人才能欣赏到;你在电脑上编辑邮件和PPT,公司的云端亦有备份,方便了你在另一台电脑上办公;公司协调办公和ERP产生的数据都存储在远方的服务器上,这样才能实现随时随地办公的梦想。服务器承担了数据存储和计算的核心工作,而数据中心又是大规模存放服务器的地方。

数据中心拥有海量数据,必须进行数据销毁才能让业主放心

既然数据中心是数据存储和处理的集中场所,海量数据的安全防护就格外重要了。传统上,数据中心的信息安全有物理保护和访问控制二种机制。物理保护是指门禁控制和物理接触控制,对于哪些人在物理层面上可以接触某台服务器的存储介质做严格的权限分配。访问控制指在逻辑层面上对数据访问权限做出详细规定,防止数据被没有权限的人获取。当然,安全策略上还有网络安全、防火墙、冗余备份、逻辑隔离等手段。不难发现,对于数据的生命周期而言,传统的安全策略聚焦于数据生命周期的产生、传输和存储等前期和中期阶段,在数据生命周期的尾声却出现了弱管理甚至忽视。下图列出了数据生命周期的六大环节,第六个格子正是末期管理之销毁,实际上却常常被忽视。

数据生命周期管理,销毁环节常被忽视

你也许会辩解,我们的硬盘数据有加密,别人不知道密钥就无法读写数据。但是,总有一个人知道你的密钥,难道不是吗?这个人或许对你忠诚耿耿,绝对可靠,但是你能保证他/她会效忠致死吗?与其把宝压在一个人身上,不如把安全交给销毁处理,这是明智的做法。有的风险不值得冒!

Stellar公司的调研发现七成数据残留有风险

你也许会辩解,我们的硬盘是RAID5读写,信息分布在不同的硬盘上,一块硬盘的数据被读取了不会影响整个系统的信息安全。但是,当你的IT经理计划硬件资产淘汰时,谁会关心几百块硬盘下架后的摆放顺序呢?谁又会去安排人员特意把同一RAID5下的盘摆放在不同的仓库呢?实际操作中,我们从来没有遇到管理如此精致的IT主管。与其痴心渴望你的IT经理如此精致,不如请一家销毁公司及时销毁数据和文件。这样的风险不值得冒!

你也许会辩解,这批硬盘由实习生使用,没有接入公司的ERP等核心系统,数据都是无关紧要的。请看看数据残留大揭秘吧,你就明白了数据其实没有紧要次要之分,只有你的IT政策是合规还是不合规之分。IT治理不合规时,没有数据是保密的和隐私的;IT治理合规时,数据没有不含隐私的也没有不敏感的,所有数据都需要保密,否则你的数据资产极有可能变为你的负债。

你必须面对一个极其残酷的现实:你的数据不一定被泄漏,一旦泄露则身败名裂,你觉得值得冒这个风险吗?这个视频讲述了数据销毁的必要性。

海量数据需要海量存储空间。这些数据中大部分都是交易数据、过程数据、用户数据或者中间计算数据,数据中心永久存留这些数据并无益处,因为存储空间需要购买,空间维护需要费用。1G的存储通常需要0.3元,1T的存储量则需要300元,若加上数据维护和电力成本分担,1T的数据量每年约需要350元的成本。与其让这些数据在数据中心的存储设备里睡大觉,不如及时销毁和清理,节省出来宝贵的存储空间迎接崭新数据的到来。这样便大大节省了数据中心的运营支出,提升了生产效率。那么,如何销毁数据呢?数据销毁和文件销毁,这里也大有学问。

首先,数据质量远比数据的数量重要,数据中心为了不断增长的数据而在软硬件上连续投资的做法,实在是一个代价昂贵的错误。需要注重有效数据的处理。表面上看,数据中心的数据总量增长是非常迅猛的,全球数据量以每年58%的速度增长,不到两年就翻一倍,在未来这个速度会更快,其中大部分数据都是在数据中心里产生的。我们的数据中心是不可能每两年就扩容一倍的容量,所以任由数据量增长下去,数据中心会很快陷入不断扩容的怪圈,结果数据中心的规模越来越大,而数据中心业务并没有实质增长,数据中心的盈利水平却在下降。就好像是一个胖子,总是吃炸鸡可乐而缺少体育锻炼,将会越来越胖,但实际上身体的体质在不断下降,最后除了一身赘肉,什么也干不了。数据切不可成为数据中心的负担,该清理时就清理,该销毁时就销毁。

其次,我们要对数据进行销毁,就要对数据进行分门别类的管理,分清哪些数据是有用的,哪些数据是无用的。这就要从数据产生的源头做起。在数据中心产生增量数据时,要将这些数据进行分类、整理归档,存储到分好类别或有标签的空间里去,同时对这些数据进行明确标记名称,通过名称就可以知道数据的大概内容,以便作为数据是否有用的判断准则。如果在数据归档记录时类别不明确,那么后来就无法做到精准销毁。管理这些数据是非常复杂的,涉及到数据辨识、清理、优化等等,而这些工作又是周期性,需要花费大量的时间和人力,且不会带来明显的收益,因此数据精细管理常常被忽视。其实,数据的有效存储工作将帮助数据中心产生长期和正面的收益,且越早部署越早行动收益越明显。

第三,数据的销毁绝不是简单的删除清空这样简单,需遵循数据销毁的行业标准。销毁的手段也有几种,这和你希望达到的效果有关。一般销毁分为软件销毁和硬件销毁两种。软件销毁指在磁盘轨道上写入大量垃圾字节,导致磁盘数据无法读取和恢复。绝大多数情况下,硬盘可以继续使用,无需外置工具,只要硬盘能读写就可以使用这个方法。销毁过程慢,通常要1到3个小时才能完成一个硬盘上的数据销毁,DOD/3Pass标准耗时1个小时以上; GUTMAN/7Pass标准需要3个小时以上。美国国防部的DOD 5220.22-M标准是应用最广的一套软体规范,许多人都把DOD 5220.22-M直接当作数据清除与销毁的标准。软件销毁常用的方法还有:格式化硬盘、硬盘分区、文件粉碎软件。格式化仅仅是为操作系统创建一个全新的空文件索引,将所有的扇区标记为“未使用”状态,让操作系统认为硬盘上没有文件,因此,若采用数据恢复工具软件是可以恢复格式化后数据区中的数据的,格式化也分高级格式化、低级格式化、快速格式化和分区格式化几种。低级格式化的销毁最为彻底,很难通过软件再将已经销毁的数据还原回来,硬盘存储空间得到充分释放。用硬盘分区的方式销毁数据,也只是修改了硬盘主引导记录和系统引导扇区,绝大部分的数据区并没有被修改,没有达到数据销毁数据擦除的目的。文件粉碎软件是专门用于彻底删除文件达到数据销毁目的的,在网上也出现了不少,一些反病毒软件也增加了数据销毁数的功能。他们用于处理一般的私人数据可以,但不能用于处理带密级的数据。软销毁一般只是将数据文件覆盖到无法识别,并不能真正将磁盘数据擦除。操作系统由于考虑到操作者操作习惯或者误操作,以及数据销毁后各种非常情况等诸多方面因素,特意安排了删除后可恢复的后门。用户所使用的删除命令,只是将文件目录项做了一个删除标记,把它们在文件分配表中所占用的簇标记为空簇,并没有对数据区进行任何改变,也就是没有对这些信息做任何数据擦除、数据销毁的操作,这样数据其实依然占用存储空间,并没有达到节省存储空间的目的。硬件销毁则通过采用物理、化学方法直接销毁存储介质,以达到彻底的硬盘数据销毁的目的,比如粉碎硬盘、高温焚烧硬盘或折弯硬盘。还有一种硬销毁是采用专用的硬盘消磁机来彻底销毁数据。不管是直接对硬盘进行消磁,还是对硬盘进行折弯,硬盘将被损坏,不仅数据不能被恢复,硬盘也无法二次使用。这种硬销毁往往用来对已经故障的硬盘进行处理,避免故障硬盘里存着的数据被坏人恢复出来。当然,在IDC大规模淘汰服务器时,通常采用这种方法销毁硬盘数据,速度快且销毁彻底。

硬盘数据销毁的方法对比

数据可以是资产,也可能是负债。数据中心拥有海量数据,数据外泄会伤害品牌、损失声誉并引发诉讼,数据维护成本居高不下会拖累公司的财务业绩。如果不及时清除数据,数据资产就演变为你的负债。及时对数据中心的数据进行销毁,不仅可以节省存储空间,节约运营成本,还可以提升信息安全,避免数据泄露。因此,彻底销毁数据对于数据中心运营至关重要。

数据销毁,对于数据中心运营意味着什么?相关推荐

  1. 信息安全与硬盘数据销毁

    电脑上最值钱的不是CPU, 而是数据.在这个信息化的时代,我们在电脑上每一步德操作每一天都或多或少地生成一些文件,然而数据的泄漏往往会造成很大经济损失. 随着计算机.移动数码设备的日益普及,包括照片. ...

  2. 数据子系统之数据节点

    数据节点是数据子系统真正执行数据存储访问的服务集群,是数据子系统中主体,其稳定性和服务性能直接决定数据子系统可用性和响应速度,该部分相对较为复杂,面对诸多不稳定因素,需要在设计阶段就开始考虑各种异常情 ...

  3. 数据中心运营:内包还是外包?

    组织在将业务迁移到托管数据中心或云端时,或者应该继续运营自己的物理数据中心必须明确说明数据中心及其运营的目标,技术支持公司的业务目标,以及数据中心是否支持该技术.因此,组织必须明确长期数据中心的目标是 ...

  4. 数据中心运营规划的基本原则

    企业需要为数据中心成功的运营制定一个有效且适应性强的计划,需要采取具体的原则来指导IT人员全面考虑其运营目标以及如何实现这些目标.但很多企业的数据中心运营的规划与努力绝大多数是放在结构设计和开发方面, ...

  5. 未来数据中心运营将靠人工智能和机器学习

    机器学习和人工智能是当今IT专业人员的热门话题,而在企业的数据中心,它们拥有真正的前景. 机器学习软件可比你或你的团队更快预测情况,甚至可能更快地解决它们.这些系统是当今混合数据中心环境的合理扩展,是 ...

  6. 如何成为一名数据中心运营工程师?

    与人类的发展历史相比,数据中心的历史很短暂,第一座数据中心设施建于20世纪50年代.最初的数据中心采用性能强大的大型机,只需要少数专业人员运行维护.而随着不断的进步和发展,采用越来越多的新技术,数据中 ...

  7. 阿里数据港张北数据中心项目本月底运营

    日前,记者在张北县小二台镇阿里数据港张北数据中心项目采访得知,目前,该项目数据机房已经建成,机房内部正在进行装修和机电设备等安装,为项目4月底交付运营做最后的冲刺. 阿里数据港张北数据中心项目是阿里巴 ...

  8. 「名词」数据管理、数据治理、数据中心、数据中台、数据湖、数据资产等

    以下内容仅供参考: 随着信息技术的不断涌现和普及,业务发展加快了数据膨胀的速度,行业内衍生了较多的新名词,如数据治理.数据管理.数据资源管理.数据资产管理等名词的定义很多,概念容易混淆,本文对这些名词 ...

  9. 数据管理,数据治理,数据中心,数据中台,数据湖这下就分清楚了!

    随着信息技术的不断涌现和普及,业务发展加快了数据膨胀的速度,行业内衍生了较多的新名词,如数据治理.数据管理.数据资源管理.数据资产管理等名词的定义很多,概念容易混淆,本文对这些名词术语及内涵进行系统的 ...

最新文章

  1. 利用JS使用POST方式提交请求的方法
  2. 人工智能新手入门学习路线!附学习资源合集
  3. 外卖排序系统特征生产框架
  4. stm32f103c8t6掉坑记
  5. Mac下搭建cocos2d 和cocos2d -x 环境
  6. 修改某个appointment已经存在的opportunity relation
  7. html在screen检索屏幕分辨率,Electron开发之screen模块-根据屏幕分辨率设置窗口大小...
  8. JMeter部分功能详解
  9. 【转载保存】基于Lucene的近实时搜索引擎优化总结
  10. 机器学习(一)梯度下降算法的实现及过程分析
  11. javascript实现下拉条联动_JavaScript gt;gt;gt; 003
  12. Python ImportError: No module named Image
  13. 小米成立“线下业务委员会”;暴风 TV 回应员工讨薪;超 98% 安卓应用不安全 | 极客头条...
  14. LVS_TUN 实验
  15. html幻灯片气泡,jQuery炫酷气泡缩略图幻灯片画廊插件
  16. 服务器电脑安装Centos7操作系统
  17. 2021第十四届“认证杯”数学建模网络挑战赛C题
  18. Urule-Pro 规则引擎 本地Urule下载 初始化教程
  19. Windows 2008 Server搭建Radius服务器
  20. python 调用另一个python文件

热门文章

  1. Rodrigues 公式推导
  2. 把话说清楚的万能公式
  3. select t.* , t.rowid from-对查询出来的sql语句进行编辑
  4. 猫眼电影院爬虫(可用)
  5. HTML5 标准规范
  6. Pytorch DEEP LEARNING WITH PYTORCH: A 60 MINUTE BLITZ
  7. CREO工程图学习笔记
  8. Android系统proc下查看cpuinfo的参数信息
  9. oss 浏览器访问pdf文件不能预览
  10. 马云欲保留控制权 阿里或放弃香港上市