Spark源代码剖析书籍推荐

  《Apache Spark源码剖析》以Spark 1.02版本源码为切入点,着力于探寻Spark所要解决的主要问题及其解决办法,通过一系列精心设计的小实验来分析每一步背后的处理逻辑。

  《Apache Spark源码剖析》第3~5章详细介绍了Spark Core中作业的提交与执行,对容错处理也进行了详细分析,有助读者深刻把握Spark实现机理。第6~9章对Spark Lib库进行了初步的探索。在对源码有了一定的分析之后,读者可尽快掌握Spark技术。

最近很多人让推荐Hadoop 2.0和Spark学习资料,今天汇总一下我学习这两套系统过程中的参考资料,供大家参考。我把这些资料分成了若干级别,不同层次的人可查阅不同层次的资料。

(1)初学者

对于初学者而言,保证最初知识的准确性尤为重要,如果刚开始获取的知识不准确,一旦根深蒂固以后将很难纠正,而且很长时间内将伴随着你,误导着你。鉴于以上考虑,我主要推荐官方网站上的相关文档,具体如下:

【Hadoop 2.0 】

Apache 版本:http://hadoop.apache.org/docs/r2.2.0/

CDH版本:

http://cloudera.com/content/support/en/documentation/cdh4-documentation/cdh4-documentation-v4-4-0.html

HDH版本:http://hortonworks.com/products/hdp-2/#documentation

注:以上几个版本基本使用和配置方法是一致的,可以相互参考,区别不大。

【Spark】

http://spark.incubator.apache.org/documentation.html

如果你的英文不够好,建议你逐步阅读这些文档,保证一手的学习资源非常重要。

(2)中高级学者

对于中高级学者,对知识的准确性有一定的判别能力和验证能力,因此会推荐一些中文资料,但仍以英文为主。

【Hadoop 2.0 】

博客:

Hortonworks博客:http://hortonworks.com/blog/

我的博客:https://my.oschina.net/BigDataInterchange/

三本书籍:

Fast Data Processing with Spark:这本书大陆还没有,网上也没有电子版,只有前几章试读。

“Apache Hadoop YARN:Moving beyondMapReduce and Batch Processing” ,YARN  leader Arun Murthy写的一本关于YARN的书籍,目前只有前两章试读(还在编写中,预定明年12月份出版)

《Hadoop技术内幕:深入解析YARN架构设计与实现原理》,该书从基本原理到内部实现,全方位介绍了Hadoop 2.0中资源管理系统YARN。具体介绍可登陆官方宣传网站:http://hadoop123.com/。

电子文档:

“Hadoop 0.23 MRv2分析”,由百度工程师编写,他的新浪微博:@大数据的wm,邮箱:infcollector@gmail.com

“Architecture of Next Generation Apache Hadoop MapReduceFramework”,这份资料来自Hadoopjira,系统全面的介绍了MRv2/YARN的来源、架构和一些内部实现细节。

Hadoop jira:

Hadoop jira是最好的学习资料,里面有大量的PDF文档、栩栩如生的对话和探讨,建议每天都读Hadoop jira,养成习惯,并参与讨论。

HDFS jira:https://issues.apache.org/jira/browse/HDFS

MapReduce jira:https://issues.apache.org/jira/browse/MAPREDUCE

YARN jira:https://issues.apache.org/jira/browse/YARN

会议及PPT:

http://spark-summit.org/

http://hadoopsummit.org/

很多PPT都放在slideshare上,需要翻墙。因此,为了能够更好的学习Hadoop,需具备翻墙能力。

转载于:https://my.oschina.net/BigDataInterchange/blog/781168

中文书籍资料推荐Spark相关推荐

  1. 机器学习书籍资料推荐

    机器学习的资料较多,初学者可能会不知道怎样去有效的学习,所以对这方面的资料进行了一个汇总,希望能够对和我一样的初学者有一定的借鉴. 1. 数学基础     机器学习是构建于数学的基础之上的,因此只有把 ...

  2. stm32编程入门_电子设计与单片机编程书籍资料推荐

    有些同学让我推荐些入门书籍,尝试写写: 注:请多看下目录与介绍,网络上也有一些读书笔记和推荐,自行判断是否符合现有层次和水平,再决定是否购买. 针对零基础.非专业的电子爱好者,我的推荐学习步骤是: 自 ...

  3. USB基础书籍资料推荐

    中文参考书籍: 1. USB系统架构图解,陈乃塘,陆克文化事业有限公司. 2. USB2.0 设计应用全揽,廖惠如总编辑,陆克文化事业有限公司. 3. USB理论规范与设计,郭士秋编着,儒林出版社,9 ...

  4. Linux运维人员成长之路必学书籍资料推荐

    附Java/C/C++/机器学习/算法与数据结构/前端/安卓/Python/程序员必读书籍书单大全: 书单导航页(点击右侧 极客侠栈 即可打开个人博客):极客侠栈 ①[Java]学习之路吐血整理技术书 ...

  5. 炼丹师入门修炼指南-深度学习入门资料推荐

    大家好,打开这篇文章,想必你也是一位对Ai充满好奇的好学青年,抑或是刚开始进入领域茫然不知所措的初级药童. 媒体对Ai对大肆宣传,似乎未来已尽在Ai之中.本着打不过就加入的原则,本文就为你分享一些学习 ...

  6. 数据仓库推荐经典书籍资料包分享

    整理了数据仓库推荐经典书籍资料包,学习数据仓库必备,包含下面的内容,包含<阿里巴巴大数据之路>和<数据仓库工具箱>等经典书籍PDF,带有书签. 微信搜索"张飞的猪大数 ...

  7. 【特别推荐】Node.js 中文学习资料和教程导航

    这篇文章来自 Github 上的一位开发者收集整理的 Node.js 中文学习资料和教程导航.Node 是一个服务器端 JavaScript 解释器,它将改变服务器应该如何工作的概念,它的目标是帮助程 ...

  8. 【经典】Java工程师必读书籍,计算机基础资料推荐

    对与做技术的人,总是感觉时间不够用.读完以下15本书,相信你的知识深度会提升很多. 1. 为什么学Java呢? 大概问一下,我们为什么学习Java呢?我思考了下,大概有以下几个原因: 热爱技术,对计算 ...

  9. 机器学习相关资料推荐 http://blog.csdn.net/jiandanjinxin/article/details/51130271

    机器学习(Machine Learning)&深度学习(Deep Learning)资料 标签: 机器学习 2016-04-12 09:16 115人阅读 评论(0) 收藏 举报 分类: 机器 ...

最新文章

  1. 百度一 29 岁程序员因使用CURL命令“篡改数据”被判有期徒刑一年九个月,并没收所有违法所得
  2. [转载] 七龙珠第一部——第057话 小雨对布鲁
  3. java 正则 捕获_Java通过正则表达式捕获组中的文本
  4. 汇编:ZF(zero flag)标志位
  5. get request uni 参数_Python+request+unittest实现接口测试框架集成实例
  6. mfc工程中添加com接口支持
  7. cc压力测试_斯坦福大学鲍哲南院士AFM综述:教你如何设计压力传感器的微结构...
  8. 【数据结构与算法】之旋转图像的求解算法
  9. HDU 2149-Public Sale(巴什博奕)
  10. 中国牙膏产业深陷 “氟中毒”?
  11. 【做题记录】统计区间(哈希/扫描线)
  12. 抑制java对修饰符的检查_Java 7对抑制异常的支持
  13. UVA - 455 Periodic Strings【字符串】
  14. 反序列化的时候出现eof exception_FastJson序列化时候出现了$ref?还不赶紧学习下...
  15. 别让for循环毁了你的程序(二)
  16. 京东批量下单_京东快递发件指南!
  17. Android 秒级编译 Freeline
  18. 优秀的程序员应该具备哪些素质
  19. linux pvs命令安装,Linux中的ldd命令和pvs命令
  20. idea 下载vue 插件

热门文章

  1. OpenGL ES Emulator比较
  2. python 视频合并
  3. android 腾讯地图导航,Android 根据地址调手机的高德,百度,腾讯地图导航
  4. KD2511N高精度直流低电阻值测试仪
  5. HTML元素大合集来了
  6. JVM参数Xms、Xmx、Xmn、SurvivorRatio...含义
  7. CentOS7安装Nvidia显卡驱动后桌面起不来
  8. 面试季,真的太狠了...
  9. python ljust 中文_Python为文档批量注音(生僻字歌词为例)
  10. android手机照片设壁纸太大,Android手机上设置一个特定的图片作为壁纸会导致手机崩溃...