中文书籍资料推荐Spark
Spark源代码剖析书籍推荐
《Apache Spark源码剖析》以Spark 1.02版本源码为切入点,着力于探寻Spark所要解决的主要问题及其解决办法,通过一系列精心设计的小实验来分析每一步背后的处理逻辑。
《Apache Spark源码剖析》第3~5章详细介绍了Spark Core中作业的提交与执行,对容错处理也进行了详细分析,有助读者深刻把握Spark实现机理。第6~9章对Spark Lib库进行了初步的探索。在对源码有了一定的分析之后,读者可尽快掌握Spark技术。
最近很多人让推荐Hadoop 2.0和Spark学习资料,今天汇总一下我学习这两套系统过程中的参考资料,供大家参考。我把这些资料分成了若干级别,不同层次的人可查阅不同层次的资料。
(1)初学者
对于初学者而言,保证最初知识的准确性尤为重要,如果刚开始获取的知识不准确,一旦根深蒂固以后将很难纠正,而且很长时间内将伴随着你,误导着你。鉴于以上考虑,我主要推荐官方网站上的相关文档,具体如下:
【Hadoop 2.0 】
Apache 版本:http://hadoop.apache.org/docs/r2.2.0/
CDH版本:
http://cloudera.com/content/support/en/documentation/cdh4-documentation/cdh4-documentation-v4-4-0.html
HDH版本:http://hortonworks.com/products/hdp-2/#documentation
注:以上几个版本基本使用和配置方法是一致的,可以相互参考,区别不大。
【Spark】
http://spark.incubator.apache.org/documentation.html
如果你的英文不够好,建议你逐步阅读这些文档,保证一手的学习资源非常重要。
(2)中高级学者
对于中高级学者,对知识的准确性有一定的判别能力和验证能力,因此会推荐一些中文资料,但仍以英文为主。
【Hadoop 2.0 】
博客:
Hortonworks博客:http://hortonworks.com/blog/
我的博客:https://my.oschina.net/BigDataInterchange/
三本书籍:
Fast Data Processing with Spark:这本书大陆还没有,网上也没有电子版,只有前几章试读。
“Apache Hadoop YARN:Moving beyondMapReduce and Batch Processing” ,YARN leader Arun Murthy写的一本关于YARN的书籍,目前只有前两章试读(还在编写中,预定明年12月份出版)
《Hadoop技术内幕:深入解析YARN架构设计与实现原理》,该书从基本原理到内部实现,全方位介绍了Hadoop 2.0中资源管理系统YARN。具体介绍可登陆官方宣传网站:http://hadoop123.com/。
电子文档:
“Hadoop 0.23 MRv2分析”,由百度工程师编写,他的新浪微博:@大数据的wm,邮箱:infcollector@gmail.com
“Architecture of Next Generation Apache Hadoop MapReduceFramework”,这份资料来自Hadoopjira,系统全面的介绍了MRv2/YARN的来源、架构和一些内部实现细节。
Hadoop jira:
Hadoop jira是最好的学习资料,里面有大量的PDF文档、栩栩如生的对话和探讨,建议每天都读Hadoop jira,养成习惯,并参与讨论。
HDFS jira:https://issues.apache.org/jira/browse/HDFS
MapReduce jira:https://issues.apache.org/jira/browse/MAPREDUCE
YARN jira:https://issues.apache.org/jira/browse/YARN
会议及PPT:
http://spark-summit.org/
http://hadoopsummit.org/
很多PPT都放在slideshare上,需要翻墙。因此,为了能够更好的学习Hadoop,需具备翻墙能力。
转载于:https://my.oschina.net/BigDataInterchange/blog/781168
中文书籍资料推荐Spark相关推荐
- 机器学习书籍资料推荐
机器学习的资料较多,初学者可能会不知道怎样去有效的学习,所以对这方面的资料进行了一个汇总,希望能够对和我一样的初学者有一定的借鉴. 1. 数学基础 机器学习是构建于数学的基础之上的,因此只有把 ...
- stm32编程入门_电子设计与单片机编程书籍资料推荐
有些同学让我推荐些入门书籍,尝试写写: 注:请多看下目录与介绍,网络上也有一些读书笔记和推荐,自行判断是否符合现有层次和水平,再决定是否购买. 针对零基础.非专业的电子爱好者,我的推荐学习步骤是: 自 ...
- USB基础书籍资料推荐
中文参考书籍: 1. USB系统架构图解,陈乃塘,陆克文化事业有限公司. 2. USB2.0 设计应用全揽,廖惠如总编辑,陆克文化事业有限公司. 3. USB理论规范与设计,郭士秋编着,儒林出版社,9 ...
- Linux运维人员成长之路必学书籍资料推荐
附Java/C/C++/机器学习/算法与数据结构/前端/安卓/Python/程序员必读书籍书单大全: 书单导航页(点击右侧 极客侠栈 即可打开个人博客):极客侠栈 ①[Java]学习之路吐血整理技术书 ...
- 炼丹师入门修炼指南-深度学习入门资料推荐
大家好,打开这篇文章,想必你也是一位对Ai充满好奇的好学青年,抑或是刚开始进入领域茫然不知所措的初级药童. 媒体对Ai对大肆宣传,似乎未来已尽在Ai之中.本着打不过就加入的原则,本文就为你分享一些学习 ...
- 数据仓库推荐经典书籍资料包分享
整理了数据仓库推荐经典书籍资料包,学习数据仓库必备,包含下面的内容,包含<阿里巴巴大数据之路>和<数据仓库工具箱>等经典书籍PDF,带有书签. 微信搜索"张飞的猪大数 ...
- 【特别推荐】Node.js 中文学习资料和教程导航
这篇文章来自 Github 上的一位开发者收集整理的 Node.js 中文学习资料和教程导航.Node 是一个服务器端 JavaScript 解释器,它将改变服务器应该如何工作的概念,它的目标是帮助程 ...
- 【经典】Java工程师必读书籍,计算机基础资料推荐
对与做技术的人,总是感觉时间不够用.读完以下15本书,相信你的知识深度会提升很多. 1. 为什么学Java呢? 大概问一下,我们为什么学习Java呢?我思考了下,大概有以下几个原因: 热爱技术,对计算 ...
- 机器学习相关资料推荐 http://blog.csdn.net/jiandanjinxin/article/details/51130271
机器学习(Machine Learning)&深度学习(Deep Learning)资料 标签: 机器学习 2016-04-12 09:16 115人阅读 评论(0) 收藏 举报 分类: 机器 ...
最新文章
- 百度一 29 岁程序员因使用CURL命令“篡改数据”被判有期徒刑一年九个月,并没收所有违法所得
- [转载] 七龙珠第一部——第057话 小雨对布鲁
- java 正则 捕获_Java通过正则表达式捕获组中的文本
- 汇编:ZF(zero flag)标志位
- get request uni 参数_Python+request+unittest实现接口测试框架集成实例
- mfc工程中添加com接口支持
- cc压力测试_斯坦福大学鲍哲南院士AFM综述:教你如何设计压力传感器的微结构...
- 【数据结构与算法】之旋转图像的求解算法
- HDU 2149-Public Sale(巴什博奕)
- 中国牙膏产业深陷 “氟中毒”?
- 【做题记录】统计区间(哈希/扫描线)
- 抑制java对修饰符的检查_Java 7对抑制异常的支持
- UVA - 455 Periodic Strings【字符串】
- 反序列化的时候出现eof exception_FastJson序列化时候出现了$ref?还不赶紧学习下...
- 别让for循环毁了你的程序(二)
- 京东批量下单_京东快递发件指南!
- Android 秒级编译 Freeline
- 优秀的程序员应该具备哪些素质
- linux pvs命令安装,Linux中的ldd命令和pvs命令
- idea 下载vue 插件
热门文章
- OpenGL ES Emulator比较
- python 视频合并
- android 腾讯地图导航,Android 根据地址调手机的高德,百度,腾讯地图导航
- KD2511N高精度直流低电阻值测试仪
- HTML元素大合集来了
- JVM参数Xms、Xmx、Xmn、SurvivorRatio...含义
- CentOS7安装Nvidia显卡驱动后桌面起不来
- 面试季,真的太狠了...
- python ljust 中文_Python为文档批量注音(生僻字歌词为例)
- android手机照片设壁纸太大,Android手机上设置一个特定的图片作为壁纸会导致手机崩溃...