作为专栏的第零篇,编外篇,我们也是考虑到在正式开始强化学习专栏内容介绍之前,给大家树立一些基础知识和学习框架。大部分关注专栏的同学都是具有数据处理、数据分析、数据挖掘、以及算法工程背景的同学。为了让大家能够统一基础认识,加深理论学习深度,我们在这里特此推出:数据科学——从计算到推理。

作者&编辑 | 行健

1 数据科学

数据科学的定义:数据科学是基于计算机科学,以数学为为主要手段,物理、生物、医疗、化学、材料、社会学科、商业等为应用目标,交叉产生的一门跨学科的综合型学科。其中数学与计算机交叉衍生出机器学习、数据分析。

数据科学的范畴:所有需要计算和验证的学科、领域都需要数据科学。数据科学为商业决策、智能分析等提供了基础工具和可应用的方法论。

数据科学中的数学理论包含:

微积分、统计学、集合论、概率论、贝叶斯概率论、经典概率论、随机过程、时间序列分析等统计概率理论,代数几何方向包含线性代数,矩阵论,群论,离散数学,微分几何,拓扑学、图论等数学分支学科。

图1.1 数据科学交叉领域

图1.2 数据科学在整个数据分析流程中的位置和作用

2 数据科学家的技能树

大数据时代,什么职业比较吃香?答案可以从今年的校招薪资列表上知道----算法工程师、人工智能研究员、数据分析等职位。那么作为一名数据科学家,应该具备的技能有哪些呢?接下来,让我们来看看数据科学家这个角色的技能树。

图2.1 数据科学家的角色

图2.2 数据科学家的技能树

数据科学家除了技术技能之外,还需要很好的非技术技能。包括好奇心,商业头脑,沟通能力以及团队合作。

3 计算到推理的桥梁

人类的智能来自于对大自然的不断探索和认知,计算和环境的融合也将是实现计算智能的必经之路。

目前主流的人工智能仍然存在许多基础问题。其中,如何让计算机理解‘常识’,成为突出问题。在我们日常的认知和判断过程中,我们与现实环境进行交互,通过个体脑海中的常识对环境做出判断,既而产生对应行动。目前AI基于“深度学习+海量数据” 训练模型的方式,并不能真正获得这种‘常识’,它更像是通过深度学习来编码一个领域的大量数据,其中神经网络的结构成为了优化计算的利器,而不是在认知这件事情本身上的努力。长久下去,机器智能将停留在暴力遍历的逻辑中不可自拔。对于唤醒机器去实现自主智能,还需要很多探索和尝试。其中,强化学习无疑是在这一领域将有突破的方向。

4 强化学习,另一种认知的角度

强化学习在机器学习中的角色

最近,Deepmind 团队发表论文《

Causal Reasoning from Meta-reinforcement Learning

》。论文认为发现和利用环境中的因果结构是智能体面临的一大关键挑战。围绕这一问题,Deepmind 团队探索了元强化学习来实现因果推理(cause reasoning)的可能。通过使用无模型强化学习训练一个循环网络来求解一系列包含因果结构的问题,训练后的智能体能够在全新的场景中执行因果推理,从而获得奖励。智能体可以选择信息干预、根据观察数据得出因果推论以及做出反事实的预测。尽管也存在已有的形式因果推理算法,论文结论表明这些推理也可以由无模型强化学习产生,并提出这里给出的更多端到端的基于学习的方法也许有助于在复杂环境中的因果推理。通过让智能体具备执行——解释——实验的能力,该研究也能为强化学习中的结构化探索提供新的策略。

从这个角度出发,强化学习为机器智能推理提供了一种可能。

5 数据科学入门必备

基础篇:《Data 8,foundations of data science》

第一本是课程《Data 8,foundations of data science》的教材。这门课程主要介绍了统计学、推理、计算机科学的一些基础理论与关键技术,以及如何提出数据问题。教材中包含了数据科学方向学生需要了解的基础知识,是以开源项目的形式进行维护的。

项目地址:

https://github.com/data-8/textbook

教材地址:

https://www.inferentialthinking.com/chapters/intro.html

作者:Ani Adhikari,John Denero

进阶篇:《Principles and Techniques of Data Science》

这门课在Data8之后,需要读者具备基本的table操作能力、概率概念、分布、分类等先修知识,还需要有Python编程基础。

项目地址:

https://github.com/DS-100/textbook

教材地址:

http://www.textbook.ds100.org/

作者:Sam Lau,Joey Gonzalez,Deb,Nolan

总结

计算到推理,需要我们系统的学习和了解我们目前科学体系获取知识的主要方法。其中统计学和实验方法论是科学家的两大利器。恰巧强化学习理论在这两方面都有涉猎。通过对目前数据科学和数据科学家角色的认识,我们更能看清数据如何在现实中发挥决策功能,提高社会生产效率和商业价值最大化。同样,也给我们新的角度和期盼去实现强化学习在这些领域的价值。

下期预告:强化学习基础概念 

有三AI-强化学习星球

强化学习知识星球创建了,免费加入,内容包括理论追新,前沿论文共读,一周一篇,强化学习工程实现,理论创新设计等,欢迎大家加入!

转载文章请后台联系

侵权必究

往期精选

  • 【强化学习】强化学习专栏上线,60多篇文章等你follow

  • 有三AI“夏季划”出炉,今夏进阶中级CV算法工程师

【强化学习】数据科学,从计算到推理相关推荐

  1. 上线数天获2400星,这个GitHub项目帮你从头开始学习数据科学

    从头开始学习数据科学的免费资源. >>>> 如何入门数据科学? 这个 GitHub 项目提供了一份免费学习资源,既包括超详细的学习路线图,又涵盖多个免费线上课程.大量数据科学项 ...

  2. 一个数据包的旅程_如何学习数据科学并开始您的惊人旅程

    一个数据包的旅程 With coming fast tech industry changes and robotic innovations, Data Science is one of the ...

  3. 数据科学学习心得_学习数据科学时如何保持动力

    数据科学学习心得 When trying to learn anything all by yourself, it is easy to lose motivation and get thrown ...

  4. 深度学习学习笔记-论文研读4-基于深度强化学习的多用户边缘计算任务卸载调度与资源分配算法

    本人学识浅薄,如有理解不到位的地方还请大佬们指出,相互学习,共同进步 概念引入 强化学习 DQN算法 边缘计算 边缘计算,是指在靠近物或数据源头的一侧,采用网络.计算.存储.应用核心能力为一体的开放平 ...

  5. 编程课程学习_如果您想学习数据科学,请从以下编程课程之一开始

    编程课程学习 by David Venturi 大卫·文图里(David Venturi) 如果您想学习数据科学,请从以下编程课程之一开始 (If you want to learn Data Sci ...

  6. 2019年学习数据科学是什么感受

    作者 | Thomas Nield 编译 | 苏克1900 来源 | 高级农民工(ID:Mocun6) 摘要:学 Excel 还是 R.Python?机器学习怎么入门?数据工程师和数据科学家有什么区别 ...

  7. 推荐!关于学习数据科学的10件事

    ↑↑↑关注后"星标"Datawhale 每日干货 & 每月组队学习,不错过 Datawhale干货 编译:张峰,Datawhale成员 我经常在我的YouTube频道Da ...

  8. 刚认识女孩说不要浪费时间_不要浪费时间寻找学习数据科学的最佳方法

    刚认识女孩说不要浪费时间 重点 (Top highlight) Data science train is moving, at a constantly accelerating speed, an ...

  9. 深度学习数据自动编码器_如何学习数据科学编码

    深度学习数据自动编码器 意见 (Opinion) When I first wanted to learn programming, I coded along to a 4 hour long Yo ...

  10. 数据科学基础_学习数据科学基础

    数据科学基础 Learn the basic components of Data Science in this beginner's course from Coding With Max. Th ...

最新文章

  1. php 绘制圆角矩形,C#_C#画圆角矩形的方法,本文实例讲述了C#画圆角矩形 - phpStudy...
  2. 你之所以没成为成就,就是因为太刻苦了!
  3. 区块链 选择交易所 五个注意点
  4. Java项目课程01:课程概述
  5. windows下curl
  6. HDU-1867A + B for you again(kmp)
  7. 闲谈IPv6-尴尬的IPv4
  8. 编程题常见输入格式处理方法
  9. Weex第一天:公共样式
  10. ASCII、Unicode、GBK和UTF-8字符编码的区别联系[转]
  11. hive不在同一台机 hue_【Impala篇】---Hue从初始到安装应用
  12. 独家CleanMyMac使用教程
  13. FireBase Android版本测试
  14. 马哥linux视频笔记,马哥linux培训第四天笔记
  15. 软件架构师的12项修炼4
  16. 使用 p6spy,拦截到持久层执行的sql及参数
  17. JavaScript中定义结构体一维二维多维数组
  18. lighttp 配置php扩展包,Lighttpd配置
  19. 一个浪漫又悲情的爱情故事——笛卡尔心形线
  20. R 语言 apply 系列函数

热门文章

  1. AssertionError: Path does not exist: py-faster-rcnn/data/VOCdevkit2007/VOC2007/ImageSets/Main
  2. Java基础提升篇:理解String 及 String.intern() 在实际中的应用
  3. MySQL数据库乱码 - Linux下乱码问题解决
  4. 中fuse_一个Fanotify和FUSE配合使用导致的问题
  5. 面试官问我有环链表中怎么找到入口,本以为很简单当场却想傻了
  6. 跳表(SkipList)设计与实现(java)
  7. 宜信(刘志波)技术培训
  8. 本地共享映射文件夹进行删除操作_从集群建立到航测建模CC(Smart3D)实用操作教程...
  9. 关于 Kubernetes 规划的灵魂 n 问
  10. 从零开始入门 K8s | 深入剖析 Linux 容器