开源的数据处理平台凭借其低成本、高扩展性和灵活性的优势已经赢得了多数网络巨头的认可。现在Hadoop将进入更多企业。IBM将在明年推出内置NoSQL技术的DB2旗舰级数据库管理系统。上个月Oracle和Microsoft也分别透露了将计划在明年发布基于Hadoop的产品。两家公司都计划提供协助部署服务和企业级支持。Oracle已经承诺将会在大数据设备中预装Hadoop软件。

大数据革命正以Apache Hadoop为中心如火如荼的进行着。自从开源分布式数据处理平台在5年前发布时讨论之声就不绝于耳。但在过去的18个月中,Hadoop赢得了客户的认可,并得到众多商业化的支持以及众多数据库和数据集成软件商的整合。在众多厂商之中最著名的三个商业数据供应商当属Oracle、IBM和Microsoft。

Hadoop会在未来成为大数据的重大技术吗?

Hadoop是一个基于Java的分布式密集数据处理和数据分析的软件框架。Hadoop在很大程度上是受Google在2004年白皮书中阐述的MapReduce的技术启发。MapReduce工作原理是将任务分解为成百上千块的小任务,然后发送到计算机集群中。每台计算机再传送会自己那部分信息,MapReduce则迅速整合这些反馈并形成答案。

Hadoop的扩展性非常优秀,Hadoop可处理分布在数以千计的低成本X86服务器计算节点中的大型数据。同时由于众所周知的摩尔定律,内存和磁盘的容量也在不断增长。Hadoop对硬件的支持也在加强,现在每个节点可部署16核的处理器,12TB甚至24TB磁盘。Cloudera透露其推出的产品每个节点的成本大约4000美元。这个价格对于关系数据库部署每TB 10000至12000美元来说极具竞争优势。

这种高容量低成本的组合引人注目,但Hadoop最吸引人的是其处理混合数据类型的能力。

Hadoop可以管理结构化数据,以及诸如服务器日志文件和Web点击流的数据。同时还可以管理以非结构化文本为中心的数据,如Facebook和Twitter。这种处理多类型数据的能力非常重要。它催生了NoSQL平台和产品。如Cassandra, CouchDB, MongoDB以及Oracle最新的NoSQL数据库。而传统关系型数据库如Oracle,IBM DB2,Microsoft SQL Server和MySQL则都不能处理混合数据类型和非结构化数据。 由于事务处理灵活性的需求,Hadoop获得大多数数据分析厂商的关注和支持。

Hadoop已被广泛应用

现今,Hadoop已被认为是非结构化数据的专用技术。低成本、高扩展性和灵活性等优势已成为处理大规模点击流量分析和广告定位等网络巨头(如AOL和comScore)的首选。

AOL三年多时间一直使用Hadoop。AOL的研发团队在加利福尼亚州的Mountain View部署了300节点的系统,该系统可以存储每天数十亿事件和超过500TB的点击流数据。点击所带来流数据是高度结构化的,但数据量是非常庞大和多样的。所以几乎不可能处理所有的提取、转换和负载工作。AOL为了解决以上问题决定使用Hadoop MapReduce处理分布在数百个计算节点的数据过滤和关联任务。由于Hadoop为业务带来的优势,AOL的Hadoop研发团队在今年四月在其总部部署了700节点的系统。

Hadoop适用于所有类型数据的特性注定将使Hadoop在更广泛的领域使用。例如提供托管服务和中小型企业应用服务提供商SunGrad。他们将计划推出基于云的托管服务,旨在帮助金融服务公司处理他们基于Hadoop MapReduce的数据处理。

商用软件厂商Tidemark最近也推出一款SaaS软件,这种基于云的性能管理应用使用MapReduce将混合数据源转化为产品或金融规划方案。

三巨头大数据领域齐发力

在上月美国拉斯维加斯举行IOD年度大会上IBM院士、DB2总架构师Curt Cotner宣布IBM将在明年推出内置NoSQL技术的DB2旗舰级数据库管理系统。他还表示未来的数据库发展方向是非关系数据库NoSQL。目前Google的BigTable和Amazon的Dynamo都用NoSQL型数据库,而传统的关系数据库在应付超大规模、高并发的SNS、web2.0网站已经力不从心。同时IBM发布了一系列数据分析软件,包括云计算版本的InfoSphere BigInsights。BigInsights是一套建立在Hadoop上的数据分析软件,能够处理企业用户收集大量非结构化资料。

微软也在10月12日在西雅图举行的SQL PASS 2011峰会宣布将与从雅虎分拆出来的Hortonworks合作开发Hadoop,并将在Apache Hadoop上实现搭建Windows Azure以及Windows Server平台。同时基于Hadoop的Windows Server还会与微软现有的BI工具联合处理任务。

Oracle作为全球最大的关系型数据库提供商也有所行动。其在2011 Oracle全球大会上推出了Big Data Appliance。Big Data Appliance是一个集成了Hadoop、NoSQL Database、Oracle数据库Hadoop适配器、Oracle数据库Hadoop装载器及R语言的系统。

Hadoop的未来

根据目前的状况来看,Hadoop作为企业级数据仓库体系结构核心技术,在未来的数年中将会保持持续增长的势头。包括MapR、Zettaset、Cloudera、HStreaming、Hadapt、DataStax、Datameer这些与Hadoop相关的新公司已经获得投资,为人们所熟知,为各种市场带来最新技术。

与此同时下一代的MapReduce会完善很多之前不尽人如意的地方。首先节点数将从目前的4000增加到6000-10000,其次并发的任务数从目前的40000增加到100000。另外将继续加大对硬件支持,同时架构也会有所改变,包括更多编程模式的支持。

转载于:https://www.cnblogs.com/h2-database/archive/2011/11/15/2583486.html

Hadoop掀起大数据革命 三巨头齐发力相关推荐

  1. 三大运营商齐发力大数据

    当前以大数据.云计算.人工智能为代表的现代信息通信技术,正在引领新一轮的产业革命.大数据能够催生出极具创新力的各类应用产品,激发出全新的商业模式,改变人们的生产和生活方式,同时不断孕育出新的产业,培育 ...

  2. TAJ齐发力 互联网巨头抢滩“区块链+票据”市场

    TAJ齐发力 互联网巨头抢滩"区块链+票据"市场 区块链技术的出现并不只是带来了"加密货币",更带来了信任机制的转变,经济运行模式的转变,使经济活动更加智能和透 ...

  3. 三剑齐发 蓄势出击:亚信新一代PaaS产品重磅发布

    PaaS:平台即服务,作为云计算的三大领域之一,现在已经不是什么新鲜事物了.早自2013年起,亚信的大数据平台专家技术团队就已组建.历经近3年的研发投入与项目实践,现在已经打造出了亚信分布式数据库系统 ...

  4. 与中国制造业相伴成长 用友三剑齐发让U9 cloud迎来新的春天

    U9c厚积薄发,臻于至善,见证并参与了中国制造走向中国创造的历程. 出品 | 常言道 作者 | 丁常彦 日前,历经十三年产品打磨和最佳实践,用友U9 cloud新品盛大发布,在业界引发广泛热议,也让多 ...

  5. 正式对标苹果,小米 12 系列三箭齐发,MIUI 欲成为跨设备操作系统

    保持热爱,共赴山海! 12 月 28 日,依旧是 19:30,小米新品发布会正式拉开帷幕. 在这场发布会上,小米新品"吸睛无数",不止一系列自研技术加持的 MIUI 13  And ...

  6. 正式对标苹果,小米 12 系列三箭齐发,MIUI 欲成为跨设备操作系统!

    保持热爱,共赴山海! 作者 |苏宓 出品 | CSDN(ID:CSDNnews) 12 月 28 日,依旧是 19:30,小米新品发布会正式拉开帷幕. 在这场发布会上,小米新品"吸睛无数&q ...

  7. 【月伴流星】GhostW7_SP1_U_x86_V2013.06_OEM通用纯净、装机、美化版(三版齐发)

    [月伴流星]GhostW7_SP1_U_x86_V2013.06_OEM通用纯净.装机.美化版(三版齐发) ______________________________________________ ...

  8. 三禧科技 工业机器人_redmi note 9 即将发布,三剑齐发! 三禧科技

    原标题:redmi note 9 即将发布,三剑齐发! 三禧科技 11月20日,Redmi官方宣布 Redmi Note 9系列来了,将于11月26日 "三剑齐发". 官宣文案中提 ...

  9. 三箭齐发!达梦数据库一体机 2023 年金融行业开门红

    2023 盛启新章,达梦数据库一体机 DAMENG PAI 吹响"开门红"的号角,金融行业三箭齐发,接连中标中邮证券.中银保险.华润银行项目.奋楫扬帆正当时,未来我们将进一步聚焦金 ...

最新文章

  1. The application could not be installed: INSTALL_FAILED_NO_MATCHING_ABIS
  2. SQL概念及DDL语句
  3. 2021年春季学期-信号与系统-第七次作业参考答案-MATLAB实验题
  4. python selenium自动化获取oracle,python27+selenium3自动化登录测试
  5. Administrator用户被禁用
  6. Oracle shared server模式连接ORA-12519
  7. Linux 禁用msi模式,禁用MSI模式支持
  8. 重磅福利!程序员面试——算法工程师面试大全第六部分
  9. php网页登录制作,thinkphp5 系统登录的实现
  10. Java通过JNI调用C++的DLL库
  11. Word写毕业论文时页眉和页脚的设置问题
  12. 数据泵并行parallel参数问题
  13. MySQL学习笔记——20170811
  14. LabVIEW控制高速微快门
  15. linux安装teamviewer黑屏,如何在CentOS 7上安装TeamViewer
  16. 爬取新浪、网易、今日头条、UC四大网站新闻标题及内容
  17. 做跨界的跳跃,不惧怕学习,不惧怕失败 —— 阿里云 MVP 裔隽专访
  18. 【英语单词2017 06 02 1】
  19. javascript单引号_避免JavaScript单文化
  20. IT行业个人职业发展

热门文章

  1. Apache common包应用集合
  2. 单臂路由配置命令_如何通过单臂路由实现VLAN间通信?(配置篇)
  3. 格式化_U盘提示格式化怎么办 U盘提示格式化解决方法【详解】
  4. java活动安排_贪心法求解活动安排(java实现)
  5. iphone退款申请教程_如何下载下架的APP?买错应用怎么退款?学会这几招iPhone更好用...
  6. 简述ospf的工作原理_简述洛氏硬度计的工作原理及应用领域
  7. 地理必修一三大类岩石_高一地理必修一知识点总结归纳
  8. 记录一次文件系统损坏的修复
  9. 清华本硕男,月入5W征婚引群嘲“普通却自信”!本人回应了……
  10. 【Python面试】谈谈对 Python 和其他语言的区别?​