《数据科学家访谈录》
【美】Carl Shan(单研) 、William Chen(陈子蔚) 、Henry Wang(汪强明)
Max Song(宋迈思)著

点击封面购买纸书https://item.jd.com/12286963.html

一、本书内容的介绍

《数据科学家访谈录》是一本对当前全球最知名的25位数据科学家的深度采访,然后汇聚成册的访谈录,读者可以从中学习到这25位数据科学领域的大师的个人经历及其成长过程,以及在各自的职业生涯所面临的各种选项时所做出的选择,具有很高的参考价值。

这25位数据科学家大都拥有国外名校的博士学历文凭,但是大都不想继续从事科研工作,而是希望能够将自己的科学研究成果应用到现实生活当中,从而让人们的生活变得更加美好,因此他们大都从学术界走向了工业界,这些大师从学术领域向工业领域转变的经历和过程非常值得学习和参考。虽然他们的专业研究领域各不相同,但数据科学这个研究方向把他们联系到一起,共同推动了数据科学领域的发展。他们各自所拥有的领域知识以及计算机专业技能,帮助他们在各自的研究应用领域获得丰硕成果,这也从另外一个方面验证了数据科学其实是一门理论与实践相结合的科学。

此外,本书当中这些大师们给出的方法论和经验也同样非常值得读者学习和思考。比如去大公司还是小公司的问题,Hillary认为应该是去那些能让你学到很多东西并且快速成长的公司。再比如做事情是从简单的开始还是复杂的做起,DJ认为做事情要从简单的开始做起,然后慢慢开始做复杂而又艰难的事情。这样子做事情就会有一个好的开始,进而一步一步的完成。

总的来说,《数据科学家访谈录》是一本经得起时间考验的好书,处于各种不同阶段的人群都可以从本书当中获取知识和经验,而且每次阅读都会有新的认识和收获。

二、数据科学的组成

1、数学相关的基础知识(85%): 包含了线性代数、概率论、微积分、统计学(工具)、机器学习(算法)等内容。

2、编程基础技能(15%): 1)SQL/NoSQL 2)Hadoop/Spark 3)R 4)主流编程语言,比如:C++/Java 5)主流脚本语言,比如:Python 6)Excel

三、数据科学的步骤

1、 获取数据 通过数据库、web接口、网络爬虫等获取网络上的数据(结构化和非结构化数据)。

2、 清洗数据 通过数值化、降维等手段去除数据噪音,实现数据的清洗。

3、 探索数据 在数据清洗工作的基础上,通过变量分析、处理缺失值、处理离群值等手段对数据进行初步的探索。

4、 数据建模 在探索数据工作的基础上,通过数学等工具建立合适的数据模型。有人认为好的数据模型是数据科学当中最核心的步骤,列出的优先级顺序是:高质量的数据>数据规模>好的数据模型。

5、 解释数据 数据可视化(D3、highcharts),通过可视化的web界面把数据和结论表达出来。

四、数据科学与大数据、人工智能的关系

大数据是一个内涵丰富的词汇,包含了技术、商业等因素的描绘,而数据科学是作为一门实实在在的应用科学而存在,是实现大数据应用的基础应用型学科,人工智能则是在数据科学的基础之上,向着让机器或程序有着类似人类智能的方向前进。因此数据科学是实现大数据的工具,是实现人工智能的基础。

数据科学也是一门理论与实践相结合的学科,并且有着与其它领域相互结合、共同发展的趋势。随着数据科学问题的规模越来越大,现代科研和应用更加强调拥有多领域、多学科背景的人进行团队合作,因此数据科学也有着软件工程的特征。

人工智能的基础是大数据(数据科学),大数据(数据科学)的基础是云计算。当前大数据技术已经与人工智能技术紧密结合,让各种程序和系统更加智能,从而进一步影响我们的生活。

五、推荐资源

1)《集体智慧编程》 2)kaggle https://www.kaggle.com/,机器学习竞赛、编写和分享代码的平台 3)Quora 获取和分享知识的平台,类似于知乎 4)吴恩达的机器学习视频课程,https://www.coursera.org/learn/machine-learning

延伸推荐

点击关键词新书:
Python|机器学习|Kotlin|Java|移动开发|机器人|有奖活动|Web前端|书单


在“异步图书”后台回复“关注”,即可免费获得2000门在线视频课程;推荐朋友关注根据提示获取赠书链接,免费得异步图书一本。赶紧来参加哦!
点击阅读原文,查看本书更多信息
扫一扫上方二维码,回复“关注”参与活动!

转载于:https://blog.51cto.com/13127751/2073111

《数据科学家访谈录》读书笔记相关推荐

  1. 读书笔记 | 墨菲定律

    1. 有些事,你现在不做,永远也不会去做. 2. 能轻易实现的梦想都不叫梦想. 3.所有的事都会比你预计的时间长.(做事要有耐心,要经得起前期的枯燥.) 4. 当我们的才华还撑不起梦想时,更要耐下心来 ...

  2. 读书笔记 | 墨菲定律(一)

    1. 有些事,你现在不做,永远也不会去做. 2. 能轻易实现的梦想都不叫梦想. 3.所有的事都会比你预计的时间长.(做事要有耐心,要经得起前期的枯燥.) 4. 当我们的才华还撑不起梦想时,更要耐下心来 ...

  3. 洛克菲勒的38封信pdf下载_《洛克菲勒写给孩子的38封信》读书笔记

    <洛克菲勒写给孩子的38封信>读书笔记 洛克菲勒写给孩子的38封信 第1封信:起点不决定终点 人人生而平等,但这种平等是权利与法律意义上的平等,与经济和文化优势无关 第2封信:运气靠策划 ...

  4. 股神大家了解多少?深度剖析股神巴菲特

    股神巴菲特是金融界里的传奇,大家是否都对股神巴菲特感兴趣呢?大家对股神了解多少?小编最近在QR社区发现了<阿尔法狗与巴菲特>,里面记载了许多股神巴菲特的人生经历,今天小编简单说一说关于股神 ...

  5. 2014巴菲特股东大会及巴菲特创业分享

     沃伦·巴菲特,这位传奇人物.在美国,巴菲特被称为"先知".在中国,他更多的被喻为"股神",巴菲特在11岁时第一次购买股票以来,白手起家缔造了一个千亿规模的 ...

  6. 《成为沃伦·巴菲特》笔记与感想

    本文首发于微信公众帐号: 一界码农(The_hard_the_luckier) 无需授权即可转载: 甚至无需保留以上版权声明-- 沃伦·巴菲特传记的纪录片 http://www.bilibili.co ...

  7. 读书笔记002:托尼.巴赞之快速阅读

    读书笔记002:托尼.巴赞之快速阅读 托尼.巴赞是放射性思维与思维导图的提倡者.读完他的<快速阅读>之后,我们就可以可以快速提高阅读速度,保持并改善理解嗯嗯管理,通过增进了解眼睛和大脑功能 ...

  8. 读书笔记001:托尼.巴赞之开动大脑

    读书笔记001:托尼.巴赞之开动大脑 托尼.巴赞是放射性思维与思维导图的提倡者.读完他的<开动大脑>之后,我们就可以对我们的大脑有更多的了解:大脑可以进行比我们预期多得多的工作:我们可以最 ...

  9. 读书笔记003:托尼.巴赞之思维导图

    读书笔记003:托尼.巴赞之思维导图 托尼.巴赞的<思维导图>一书,详细的介绍了思维发展的新概念--放射性思维:如何利用思维导图实施你的放射性思维,实现你的创造性思维,从而给出一种深刻的智 ...

  10. 产品读书《滚雪球:巴菲特和他的财富人生》

    作者简介 艾丽斯.施罗德,曾经担任世界知名投行摩根士丹利的董事总经理,因为撰写研究报告与巴菲特相识.业务上的往来使得施罗德有更多的机会与巴菲特亲密接触,她不仅是巴菲特别的忘年交,她也是第一个向巴菲特建 ...

最新文章

  1. C#Swagger使用
  2. 【计算机网络】计算机网络 OSI 参考模型 与 TCP/IP 参考模型 对比
  3. Day14:使用斯坦福 NER 软件包实现你自己的命名实体识别器
  4. c语言题目及答案1037,PAT Basic 1037. 在霍格沃茨找零钱(20)(C语言实现)
  5. VS2013支持多字节
  6. ES6的generator
  7. linux用mame玩游戏,Ubuntu下用kxmame运行精彩的街机游戏
  8. Day06,selenium的剩余用法、万能登录破解和爬取京东商品信息,及破解极验滑动验证码...
  9. HashMap底层实现(源码分析)
  10. 【数学建模】基于matlab模糊二元决策树【含Matlab源码 038期】
  11. web前端笔试题整合
  12. 扩展工具将网页保存为PDF
  13. easyui radiobutton
  14. 一个div实现太极图案+动画(简单易懂)
  15. Torch中的benchmarkdeterministic是什么含义?
  16. clion设置为中文_手把手教你去除CLion的中文字符乱码
  17. 3种方式,中小企业资产轻松盘点
  18. ae计算机配置要求,AE和PR要求电脑的最低配置分别是?
  19. 看我解决Linux下的OTG切换问题
  20. 以太网阻塞的常见原因与解决方法

热门文章

  1. sql中 set 和select 的区别
  2. [转]RFC 2866 RADIUS Accounting -中文翻译
  3. java 冒泡_java实现冒泡排序
  4. 北斗导航 | 监测和减轻空间天气对GNSS应用的影响
  5. C语言 | 编程实现4
  6. php odbc连接sqlserver,php pdo连接sqlserver配置
  7. 关于“指针的指针”的认识(值传递、指针传递区分)
  8. 数据竞赛:第四届工业大数据竞赛-虚拟测量
  9. 程序员食品营养(2)-日式乳酪酱和巧克力酱
  10. python源码精要(9)-CPython内部原理快速指南(1)