他是IBM IT技术创新者最高荣誉IBM Fellow的获得者;他领导过IBM“网格计算”战略;他是EMC公司院士及杰出工程师评估委员会的创始人和主席;他在EMC设定技术方向上扮演着重要角色。多年来, 他一直走在IT技术变革的最前沿,他就是EMC高级副总裁及CTO Jeff•Nick。近日,Jeff•Nick先生接受了Watchstor独家专访,畅谈了对云计算、大数据等热门技术的看法。

从网格计算、云计算到大数据---这是场进化论

回顾过去十余年的IT发展历程,网格计算、云计算和大数据是不可饶过的三大话题。网格计算曾经轰轰烈烈,最终却是无疾而终;云计算亦是风起云涌,逐渐走向落地之时仍不乏质疑之声;大数据现在风头正劲,引发的争论却也是最为激烈。每一场IT技术变革都有其背后的前因后果,无论网格计算、云计算还是大数据,甚至未来接踵而至的某个IT新概念,都需要从各方面去洞悉它们的本质。

EMC CTO Jeff•Nick则认为从网格计算到云计算,再到大数据,犹如一场IT的进化,他表示:“网格计算其实就是云计算的前身,以前我们称之为公用事业型计算,它主要研究如何通过互联网来实现资源共享和统一分配。网格计算和云计算其实是连在一起的。从技术成分来看,云计算和网格计算存在很多共性,比如在网格计算结构上部署一个应用和在并行处理多节点上共同运行一个Hadoop作业具有很多相同特性。”

图一:EMC公司高级副总裁兼首席技术官Jeff-Nick接受Watchstor独家专访。

事实上在IT发展历史中,如果某种技术不能够很好的商业化和市场化,那么这项技术即便再出色也不能够获得很大的市场认可和成功。EMC CTO Jeff•Nick认为云计算其实就是网格计算走向商业化的结果,他表示:“网格计算其实是来自高校和科研单位等做研究的圈子的呼声,是满足研究圈的需求,而云计算只不过是商业化或者商品化的IT。现在非常商业化的生命科学应用、天气预报应用或者油气勘探应用和过去网格计算所作的HPC功能界限已经非常模糊了,这就是云计算商业化的体现。”

Jeff•Nick还认为大数据会是云计算总体进化的下一个步骤,他表示:“其实让我们仔细分析一下云计算发展过程就会发现为什么会有大数据的产生。云计算第一阶段是推动了资源共享,这也是网格计算的一个特点;第二步是把应用放在云端,就是我们通常所说的SaaS服务(软件即服务);第三步是PaaS平台的搭建;第四步就是统一的数据分析,也就是我们现在谈到的大数据。”

数据是未来的核心所在

基金公司动用Hadoop分析社交网络用户情绪来预测股票市场走势、大型零售超市通过分析商品位置数据来分析用户购买行为、购物网站通过用户点击数据来分析广告投放位置、油气公司通过分析各种勘探数据来寻找油气资源……诸多鲜活的案例似乎在告诉人们:一个数据分析的时代已经到来,一场挖掘数据价值的革命正在进行。

EMC 高级副总裁及CTO Jeff•Nick表示:“我认为经济现在不光在全球化,经济还在信息化。这种信息化的经济指的是人们渴望能够获得更多的洞察力和获得更多有利的价值。这些价值不仅仅是商业价值,还包括社会效益价值,而这一切则都依赖我们对信息和数据的制造、处理以及对它的快速响应。”

大数据时代已经到来,大数据所带来的价值真如厂商们描绘的那么美好么?事实上,大数据概念诞生就产生了比云计算以往任何IT概念更大的争论,对于大数据的质疑之声从来没有停止过,这种质疑可谓是全方面的,包括法律法规、商业价值、商业创新、技术手段等。比如在法律法规方面,对于企业自身而言,要想获得最为准确的商业洞察力,所希望获得的数据样本应该是越大越好,这无疑将超出企业自身业务数据的范畴,企业自身自然而然希望获得更多的外部数据,而这些外部数据来源的合法性如何去定义尚处于法律空白;又比如在数据有效性方面,企业每天有新增的有价值数据,也会有部分数据失去它的价值,如果去判断数据的有效性,如何去挖掘有效数据的价值仍然是需要企业去面对的一大难题。

对此,Jeff•Nick表示:“有句老话是‘车到山前必有路’。如果出现了一个问题,但利益的吸引又非常之大,人类社会总会找到一种方法去克服。我们不能忽视正在发生的现象是:我们正在整个数据价值链上攀升,过去我们做的仅仅是一些关系型数据库,而现在我们正在往上走,通过Hadoop做数据分析、做信息的横向扩展、实现云端的数据共享,这些其实都能够帮助我们从整个信息的生态链上产生更大的价值。” Jeff•Nick的观点让人想到网银的发展,网银从出现之初到现在一直面临着安全的问题,但网银并没因此而消失,反而得到极大地普及,并给人类生活带来了巨大的便捷。

除此之外,Jeff•Nick还强调了数据从量变到质变的重要性,他强调:“数据越来越像地球引力,数据量达到了一定程度就会引发量变到质变,就像地球引力一样,它的重要性就会显著提升。”

为此,Jeff•Nick特意举出了三个大数据有趣现象:“第一个例子就是私有数据云,我们发现现在越来越多企业在数据生成、数据分配上并不在传统的数据中心之内,很多企业开始专门建立专有数据的私有云,它本身包含多个数据中心,数据分析工作并不会集中在一个数据中心,把数据分析能力放在数据所在的站点去做会更有效,这也就是为什么私有数据云现正正在快速兴起;第二个例子就是共生数据云,这是一个联合的数据云或者合成数据云,比如Twitter如果对某个话题感兴趣,需要把这个话题相关信息提取,这需要强大的实时数据分析能力,Twitter可以将针对这个话题每个小时产生的数据包传输给另一家专门做数据的公司,这家公司对这些数据进行分析之后再将结果交换给Twitter,这就叫共生数据云现象;另外一个例子就是大数据分析对于社会福利的创造非常有利,比如在医疗领域,通过数据分析对于基因的研究,对个人医疗方案的优化,这是社会公益型的数据云。”

大趋势,不可逆。虽然大数据在商业决策和商业创新上仍然有着很大的质疑,但是经济走向信息化的今天,以数据为核心正在颠覆过去传统的商业模式。暂且不去讨论大数据对于商业创新有多大帮助,大数据给人类社会的福利、社会效益、商业模式优化的确有着广泛的应用前景。

EMC的数据核心战略

如同IT转型到大数据时代一样,EMC同样谋求在大数据时代进行转型。EMC的转型的确给业内带来了诸多疑问,比如说EMC是否会进入服务器市场;与Cisco、VMware组成的VCE联盟的市场策略和发展方向;在集成化趋势越来越明显的今天,如何与那些综合性厂商进行竞争等等。针对这些,Jeff•Nick明确向Watchstor阐述了以数据为核心的EMC转型战略。

在2012年EMC World上,EMC公司展示了针对运行阵列中应用的专有服务器模块,这再一次引发了业内对EMC 将进入服务器市场的猜测,毕竟服务器就是服务器。Jeff•Nick则从产业和技术层面阐述了EMC为何这么做:“事实上现在业内正在发生的事情就是,IT基础模块围绕X86平台的产品逐渐走向商品化和普遍化。目前服务器和存储阵列基本都采用了英特尔处理器和闪存技术,这等于创造了把一些不同的IT功能放在数据中心能够发挥作用的地方的机会。回顾传统的做法,与服务器相关就会固定在服务器中,与存储相关就会被锁定在存储阵列之中,为什么就不能把数据功能放在数据服务器之上?数据服务器为什么就不能是一种阵列?它们的底层构件都是一样的。比如一个查询命令,过去必须从阵列中调出数据块,然后通过网络传到服务器,这个服务器要根据自身查询的内容至少要扔掉90%的数据块,所以为什么不能够进行改变?整个查询部分不通过网络,在阵列中进行完成,把跟查询相关的数据直接发送到服务器。EMC为什么会想采用这种办法,其实是想实现更加智能的方式管理数据的服务。EMC可以实现端到端的完整的数据服务。比如VFcache功能,可执行服务器、闪存、阵列全部层次的数据策略管理。”

实际上,无论是EMC还是其他厂商,目前都在做的事情就是希望能够将产品更加集成化,抛开过去各个产品各自处理的做法,通过高度集成化的产品来最大限度提升效率。更有甚者,将一些像数据库、中间件等关键应用进行深度的软硬件一体化集成来提供给用户,并且在市场上博得了大量眼球。Jeff•Nick谈及这种市场现象之时表示:“通过EMC做VCE联盟以及VSPEX来看,客户是非常习惯融合架构和集成一体化产品,客户希望能够把所有IT产品放在一个机器里面,把所有东西都当做一个IT硬件设备来对待。服务器、网络、存储是IT基础架构的三大基石,我们考虑的是在这三大基石之上来打造一个统一数据平台,以数据为核心,提供数据分析、数据去重、数据分层、文件系统等数据服务,对于用户而言,他拿到的是统一的、融合数据服务的设备。”

在这个集成的时代,综合性厂商似乎有着天然的优势,拥有全面产品线以及整合能力使得综合性厂商在集成化方面获得更广泛的市场认同,而市场上针对EMC、Cisco和VMware组成的VCE联盟仍然有着不少质疑。比如,Cisco在自身刀片服务器之中采用了Fusion-IO的闪存卡,VCE联盟中Vblock将采用EMC的VFcache还是Fusion-IO产品?EMC 高级副总裁及CTO Jeff•Nick并没有正面回答这个问题,他表示:“EMC坚信的就是同类最佳技术才是用户的需求,客户会决定哪种技术或者哪种产品。同时,EMC也相信只考虑到利益的互补关系而非同类最佳产品的合作伙伴关系并不会非常牢靠。比如闪存策略,EMC具有最为全面的产品线,EMC在阵列中采用了闪存,VFcache保证服务器和阵列之间的数据一致性,FAST-VP技术能够很好的管理闪存数据,还有Xtreme IO技术,从整个堆栈的闪存技术来看,EMC无疑是最佳的。随着时间推移,我们相信还是同类最佳技术才是真正符合客户需求,也是客户的最佳选择。”

原文地址:EMC CTO:IT进化到“以数据为核心”的阶段

转载于:https://blog.51cto.com/yuanshaolong/984547

EMC CTO:IT进化到“以数据为核心”的阶段相关推荐

  1. 4月22日丨【云数据库技术沙龙】技术进化,让数据更智能

    4月22日,云数据库技术沙龙"MySQL x ClickHouse"专场 "MySQL x ClickHouse" 技术沙龙,本次沙龙以"技术进化,让 ...

  2. 阿里巴巴集团CTO王坚:互联网、数据和计算

    阿里巴巴集团CTO王坚:互联网.数据和计算 发表于2015-12-10 09:44| 1159次阅读| 来源CSDN| 0 条评论| 作者唐小引 BDTC大数据技术大会阿里巴巴云计算大数据王坚CTO计 ...

  3. 杭州数澜联合创始人 \u0026 CTO 江敏:大数据思维和大数据冶炼 —— 拒绝坐着金山吃馒头...

    大家好,我是江敏,来自杭州数澜科技.我在 2007 年加入同花顺,前期主要做服务端的架构研发,后期主要负责组建同花顺大数据团队和构建大数据平台.2013 年,我加入阿里数据平台事业部数据服务团队,构建 ...

  4. 【Genome Biology 2023】EvoAug:通过进化启发的数据增强,提高基因组 DNN 的泛化和可解释性

    EvoAug: improving generalization and interpretability of genomic deep neural networks with evolution ...

  5. DT时代,大数据最核心的意义是什么?

    大数据最核心的价值就是在于对于海量数据进行存储和分析.相比起现有的其他技术而言,大数据的"廉价.迅速.优化"这三方面的综合成本是最优的. 当这项技术在自己用的时候,自己将会非常收益 ...

  6. 互联网时代大数据的核心价值

    都说现在是大数据时代,那么大数据是什么?大数据有什么用?大数据最核心的价值是什么呢?其实大数据的核心价值很简单,就是了解用户行为(更简单说就是了解用户行为习惯).今天我们就细说大数据的核心价值. 一. ...

  7. 自学it18大数据笔记-第三阶段Spark-day04——会持续更新……

    笔记为自学时随手记录,如有错误,欢迎指正,不胜感激!现已广州转移至上海,欢迎小伙伴们加qq或微博沟通交流(QQ,微博和博客同名) 笔记分享:自学it18大数据笔记-第三阶段Spark-day04--会 ...

  8. 架构漫谈 - 数据治理核心思路及解决方案探讨

    文章目录 Pre 背景和挑战 数据治理的框架和核心内容 数据战略 组织管理 制度体系 流程管理 绩效管理 标准体系 质量体系 安全体系 平台工具 人工智能是大数据治理核心方向 小结 Pre 数据治理是 ...

  9. 自学it18大数据笔记-第三阶段Scala-day06——会持续更新……

    笔记为自学时随手记录,如有错误,欢迎指正,不胜感激!现已广州转移至上海,欢迎小伙伴们加qq或微博沟通交流(QQ,微博和博客同名) 笔记分享:自学it18大数据笔记-第三阶段Scala-day06--会 ...

  10. 以数据为核心的SOC3.0时代到来

    大部分企业和组织已经从安全的局部建设进入到了整体优化阶段.当前的客户更加关注全网的整体安全,强调从业务信息系统安全风险的角度,而非单一安全威胁和防御机制的角度去更加主动地管理安全.而要做好安全管理工作 ...

最新文章

  1. 最简单EXT调用WCF
  2. HDU4549 M斐波那契数列 —— 斐波那契、费马小定理、矩阵快速幂
  3. 6.7级地震!北海道数据中心陷最长停电危机!
  4. 第五个神奇的电梯(2)
  5. 宝鸡文理学院c语言试题,宝鸡文理学院试题电子电磁场与电磁波A
  6. Resize Datafile时ORA-03297: 文件包含在请求的 RESIZE 值以外使用的数据
  7. 我是如何晋升专家岗的
  8. php redis 设置密码,redis如何修改默认密码
  9. linux统计某种文件大小命令,linux下对符合条件的文件大小做汇总统计的简单命令...
  10. 数学建模入门篇(0基础必看,全是自己的经验)
  11. yum 与pip区别
  12. pro android python with sl4a,Pro Android Python with SL4A
  13. 计算机科学与技术专业读书笔记300字,计算机读书笔记.doc
  14. admob 服务器验证_Admob广告植入过程中遇到的错误汇总
  15. 基于FFMPEG的封装格式转换器
  16. 博弈论的一些基础知识(参考网络资料,学习总结,很好,分享并保存)
  17. Electron学习笔记 4 添加系统功能
  18. Python学习——作图plt.cm.Set()用法
  19. krpano教程:Videoplayer插件中文说明
  20. 年终总结 | 盘点2020展望2021

热门文章

  1. spring学习笔记整理--03(Spring的三种实例化Bean的方式)
  2. 运行100万秒无错误!
  3. exp/imp导出导入工具的使用
  4. 洛谷 P1962 斐波那契数列
  5. POJ 2923 Relocation(状压DP)题解
  6. 使用 Selenium开展Web测试
  7. Android使用adb命令查看CPU信息
  8. Jzoj5445【NOIP2017提高A组冲刺11.2】失格
  9. 《结对-网页贪吃蛇游戏-需求分析》
  10. window.parent.document jquery