作为一个非计算机专业的学生,读完谷歌三篇重要论文之后,因为专业知识的限制实在是没有办法完全理解。(我太难了555)

尽管不能完全理解,但通篇阅读后,还是有所体会,三篇论文在我的脑海里留下了一些关键字,比如,海量、TB级、PB级、并行化、分布式……

谷歌的三篇论文介绍了Google Bigtable, Google

MapReduce和Google

File-System三个重要工具。它们有一个共同点——分布式系统。而这个分布式就是将一个业务分拆多个子业务,化整为零,分别放在在不同的服务器上。经过输入、分块、整合、输出四个部分,好比一个大的任务,分配给多个小组共同分工、合作,最后汇总完成。

论文中频繁出现词语海量、大规模数据、超大数据集、TB级、PB级……这些表示数量的词汇都可以很明显地向我们转达出:Google

MapReduce ,Google File System,Google

Bigtable,三个系统或是模型均是为了处理“海量”的数据而出现和设计的。而这个“海量”之所以打上引号,就是为了强调数据的庞大,一般的大、巨大、庞大,不足以描述其数据量大的程度,应该只有用数量级来计量才足够。

在我的理解中,MapReduce

的设计主要体现出了一种“化整为零”再“化零为整”的思想。比如,论文中提到,“用户程序首先调用的MapReduce库输入文件分成M个数据片度”。基本上都是采用了分割和拆分的方法去处理大量的数据,把问题分解成为大量的“小”任务,很好起到化繁为简的作用,可以使很多复杂的问题的得到简单的解决。

下图为 MapReduce实践中操作的全部流程

对于Google File System

,可以在廉价的普通硬件设备上运行,为大量客户机提供高性能服务。

而Google Bigtable

,则是一个分布式的结构化数据存储系统,同样是被设计用来处理海量数据(通常是PB级)。

Google的三篇技术论文意味着世界进入大数据时代,数据计算速度的极大提升,也为各个领域提供了新思路。通过与各个领域的结合与应用,相信未来,大数据与人工智能一定有更好的利用和发展!

谷歌大数据三篇论文标题_谷歌三篇重要论文读后感相关推荐

  1. 读谷歌大数据三篇著名论文有感

    文章目录 第一篇:Google File System 第二篇:Google Bigtable 第三篇:Google MapReduce 三篇论文看完后的想法 第一篇:Google File Syst ...

  2. 大数据与O2O:能看到的三四线城乡互联网的未来

    今天,看到朋友罗超在朋友圈抱怨,春节过后,竟然没有人写互联网回乡见闻和三四线城市互联网真相,打开几家科技媒体平台,果然没有太多类似的文章,大家每年几乎都会有这么几篇所谓接地气的文章,然后随着时间的推移 ...

  3. 谷歌大数据三篇论文标题_抖音短视频标题怎么写才能上热门?起标题的3个实操步骤,大数据分析爆款标题的套路...

    抖音短视频运营学习路线图,带你全面系统性学习抖音短视频运营! 第十一篇:抖音短视频标题撰写技巧. 1.了解视频标题应该具备的特点. 2.掌握起视频标题的3个实操步骤. 3.掌握起视频标题的注意事项. ...

  4. 谷歌大数据的三驾马车

    本文介绍大数据分析的鼻祖型论文"谷歌三驾马车".这包括处理分布式数据的mapreduce.存储大量数据的gfs以及列式存储bigtable,当前流行的大数据技术都是在谷歌发表了这三 ...

  5. 大数据:技术与应用实践指南_大数据技术与应用社团 社会实践总结篇

    不知不觉,我们已经在家里呆了七个月了 也不知道宿舍还好吗 小伙伴们有没有在家好好学习 在这个漫长的假期里,我们热爱学习的大数据技术与应用社团举办了为期七天的社会实践活动. 本次实践活动主要内容为网页设 ...

  6. 大数据产品开发流程规范_大数据技术思想入门(三):分布式文件存储的流程

    如果你不喜欢阅读文字的话,可以选择滑到最后看 视频讲解 哟~~~ 进程和 RPC 在上一篇文章中,我们讲解了要解决好大数据集的存储问题,需要引入一个主从结构的集群,其中,主服务器用于存储元数据,从服务 ...

  7. 中国力量占领KDD:包揽“大数据领域世界杯”全部冠亚军,北航拿下最佳学生论文奖...

    萧箫 发自 凹非寺 量子位 报道 | 公众号 QbitAI 数据挖掘.知识发现领域的最高学术会议--KDD 2020的所有奖项已全部公布. KDD,全称Knowledge Discovery and ...

  8. 大数据技术 学习之旅_为什么聚焦是您数据科学之旅的关键

    大数据技术 学习之旅 David Robinson, a data scientist, has said the following quotes: 数据科学家David Robinson曾说过以下 ...

  9. 大数据技术 学习之旅_如何开始您的数据科学之旅?

    大数据技术 学习之旅 Machine Learning seems to be fascinating to a lot of beginners but they often get lost in ...

最新文章

  1. 牛客网暑期ACM多校训练营(第六场)J Heritage of skywalkert
  2. Android中GridView的实现实例
  3. Celt Codec简单使用方法
  4. 数据湖之iceberg系列(一)iceberg能做什么
  5. Java+Windows+ffmpeg实现视频转换
  6. 源码与tarball套件管理程序笔记摘录
  7. 自己使用的一个.NET轻量开发结构
  8. C语言试题四十六之将m行n列的二维数组中的字符数据,按列的顺序依次放到一个字符串中。
  9. JEECG 社区官方技术支持
  10. 怎样申请 Google Map apiKey
  11. 一文了解数据库索引:哈希、B-Tree 与 LSM
  12. js 字符串去除空格
  13. 三相PWM整流器(simulink仿真搭建)
  14. ES8316耳机驱动可以差分输入支持录音PEQ调节
  15. 微信公众号里面服务器配置关闭,微信公众号服务器配置无法修改
  16. 电容或电感的电压_如何通俗的理解电流,电压,电阻,电容和电感?
  17. POJ - Art Gallery(半平面交)
  18. bootstrapTable动态渲染数据获取
  19. 计算机文化期末试卷,计算机文化基础期末试卷.pdf
  20. 服务器风扇插头型号,服务器风扇专场 台达 12V   12CM 4.8A怪兽来袭只要15元

热门文章

  1. 流形学习(Manifold Learning)简单介绍
  2. java设置rgb_设置Java中的自定义RGB颜色
  3. hystrix集群及集群监控turbine
  4. 微信小程序 - 日期时间选择器(年月日时分秒)
  5. 安卓触摸手势事件实现图片跟着手指移动和图片缩放
  6. 分组加密模式 ECB CBC OFB CFB ,分组加密填充
  7. 1.设计用户登录表、学生表、导师表
  8. 2021-2027全球与中国辉光放电光谱仪市场现状及未来发展趋势
  9. Python爬虫学习笔记_DAY_18_Python爬虫之handler处理器的使用【Python爬虫】
  10. docker 可视化工具 kitematic