自从我毕业以来,先是火机器学习,然后火大数据,之后火深度学习,现在火人工智能这些算法领域。越来越多的朋友想从工业,金融等等行业转行到算法相关的行业,我一年前在知乎上写了一个答案本科生怎样通过努力拿到较好的机器学习/数据挖掘相关的offer?,当时拿了不少的赞,所以也一直有同学找我咨询相关的问题,确确实实也有相当一批人拿到了不错的offer。
我个人不是很喜欢更新非技术的文章,但是我还是觉得如果能帮助到一些人,其实也是另一种技术输出的展现,所以我就写下了下面这篇短文,希望对迷茫的人有所帮助。
首先,转机器学习的难度如何评估?
今天一大早,我在刷知乎的时候,刷到这个题目非计算机专业学生如何转行AI,并找到算法offer?,我看到这个叫做BrianRWang的答主的一个“10问检验你的基础水平”,我觉得是至少我看来非常全面考验数学基础的,所以这边就和大家分享一下(答案我会在最后给出,有兴趣的最好自己做一下,括号里面的我个人觉得没有意义所以没有给出解释,有兴趣的却又解不出来的同学可以私信我):

1.什么是贝叶斯定理?请简述其公式?现分别有 A,B 两个容器,在容器 A 里分别有 7 个红球和 3 个白球,在容器 B 里有 1 个红球和 9 个白球,现已知从这两个容器里任意抽出了一个球,且是红球,问这个红球是来自容器 A 的概率是多少?

这题考了概率论的基础,虽然考了贝叶斯,但是后面的容器问题完全可以不用贝叶斯也可以算出来,算是一题数学敏感度的测试题,看看自己适不适合去努力切入这个方向。

2.请简述卡方分布和卡方检验的定义?(给你一个2*2的列表让你算卡方分布,你会怎么做?)

这题考了梳理统计的基础,括号里面的我个人觉得没有意义,有兴趣的可以查表算一下。

3.在概率统计学里,自由度是如何被定义的,又该怎样去应用?

原作者BrianRWang认为这题比较偏,属于冷门题目。个人看法:其实我觉得如果是任何一个理工科的同学,这题都应该能答出来,大学的课程里,自由度的理解直接决定了统计科目大家的学习质量。
以上的三题考了概率论与数理统计的基础,在机器学习理论中,概率论和数理统计的基础是否扎实直接决定了能否很好的理解各个理论的前置条件,适用场景,提升方向等,着实重要。

4.请简述什么是线性代数里的矩阵特征值和特征向量?(求矩阵:A=np.array([[1,2],[3,4]])的特征值,特征向量,写出其运算公式)

线性代数题目,很简单给出对应的公式即可,我在SVD介绍的时候就完全讲过。如果换成,如何理解特征值及特征向量在空间中的实际意义,这题就会变得非常卡人。

5.如何使用级数分解的方法求解e^x?(并给出在数值计算中可能遇到的问题。)

数学分析的题目,一个公式。
以上的题目都是线性代数,数学分析的题目,都是比较考验大学的基本功,如果不记得也很正常,只要能说出大概的思想就行,比如空间选择啊,点导数展开。

6.数据结构的定义是什么?运用数据结构的意义是什么?

计算机题,这题应该是几个问答中最简单的了。

7.请说明至少两种用于数据可视化(data visualization)的package。并且说明,在数据分析报告里用数据可视化的意义是什么?

前一问如果主动接触过计算科学的人这题比较好答,如果是纯新手,这题就是无从下手的。后面一小问也是属于考察你的数据敏感度的,如果能够match到一些点,很加分。

8.假如让你用编程方法,比如python,处理一个你没见过的数学问题,比如求解一个pde或者整快速傅里叶变换,你应该查什么东西,找哪一个package的参考资料?

同上一条前一部分。

9.请简述面向对象编程和函数式编程分别的定义,并举出其案例。

计算机题,考了基础的编程的一些风格的了解程度,说实话,这题我第一次看到也很懵,还去Google了一下。
原作者还有一个第10题,不涉及技术,我就没放。以上四题更偏向coding的能力,虽然说算法工程师、数据挖掘工程师、NLP工程师,等等,都是挂着科研的title,但是过硬的coding能力是完全不能缺少的,要其他人把很复杂的数学理论用代码帮你实现出来的交流成本巨大,我觉得精通或者熟悉至少一门语言还是非常重要的。
原作者认为:

以上提问如果能闭卷对7个及以上,证明一个学生的基础还是比较好的。只要聪明肯学,一定是有所裨益的。在7个,到3个之间,不妨提高一下自己的数学水平;努努力还是可以学会机器学习的。如果写对不了两个(“这都啥啊?”),郴州勃学院复读班欢迎你过去。

其实我还是比较认同的,答对3个或者2.5个以上的同学,完全可以试一试转一转,我觉得不存在说入不了门的情况。能答对7个或者7.5以上的同学,我觉得可以投简历了,如果我收到你的简历,即便是你没有历史的工作经验,我很愿意让你试一试的。
一些资料
很多转行的朋友会问我,到底看什么书会比较好,我刚开始会推荐一堆,后来自己想了想发现,还是太天真,大家工作忙的要死,看一本就很难了,别说一堆。
我最后就浓缩了三本::周志华老师的西瓜书(《机器学习》周志华 清华大学出版社),李航的带你玩转基础理论(《统计学习方法》李航 清华大学出版社),经典厕所读物(《数学之美》吴军 人民邮电出版社)。
确实是很经典很经典的书,我现在基本上每次必回答以上三本。
除此之外,在coursera上找吴恩达(Andrew Ng)教授的机器学习课程,他把要用到的数学知识也做了简单的讲解,机器学习方面的理论和算法讲的也很详细,而且很基础,肯定可以看懂。Machine Learning | Coursera,应该是最适合看的视频类的资料没有之一。
我不反对也不支持大家去参加几千几万的速成班,几十几百的live课程,但是我觉得你不妨先看完以上的书和视频再做决定,一定不会让你失望。之前我一直在给team做吴恩达(Andrew Ng)在线课程的分享,一直到最近我发现不如整理出来给team以外的大家一起看算了,所以在Gradient Checking(9-5)这节课之后的所有课程,如果有价值的地方,我都做了笔记后面会分享在我的GitHub中,希望给大家一些帮助。
最后,希望我们都不负自己的青春。

作者:slade_sal
链接:https://www.jianshu.com/p/620a2ddc2846

写给想转行机器学习深度学习的同学相关推荐

  1. Java软件研发工程师转行之深度学习(Deep Learning)进阶:手写数字识别+人脸识别+图像中物体分类+视频分类+图像与文字特征+猫狗分类

    本文适合于对机器学习和数据挖掘有所了解,想深入研究深度学习的读者 1.对概率基本概率有所了解 2.具有微积分和线性代数的基本知识 3.有一定的编程基础(Python) Java软件研发工程师转行之深度 ...

  2. AI:一个20年程序猿的学习资料大全—人工智能之AI/机器学习/深度学习/计算机视觉/Matlab大赛——只有你不想要的,没有你找不到的

    AI:一个20年程序猿的学习资料大全-人工智能之AI/机器学习/深度学习/计算机视觉/Matlab大赛--只有你不想要的,没有你找不到的 目录 (有偿提供,替朋友转载,扫描下方二维码提问,或者向博主扫 ...

  3. 刚发布!开发者调查报告:机器学习/深度学习算法工程师急缺

    近日,CSDN发布了<2019-2020中国开发者调查报告>,本报告从2004年开始针对一年一度的CSDN开发者大调查数据分析结果形成,是迄今为止覆盖国内各类开发者人群数量最多.辐射地域. ...

  4. 机器学习深度学习加强学习_我如何在9个月内学习深度学习

    机器学习深度学习加强学习 There are so many resources out there that can teach you deep learning, and if you are ...

  5. 机器学习/深度学习/自然语言处理学习路线

    原文地址:http://www.cnblogs.com/cyruszhu/p/5496913.html 未经允许,请勿用于商业用途!相关请求,请联系作者:yunruizhu@126.com转载请附上原 ...

  6. 机器学习+深度学习笔记(9.5更新~)

    Note ​ 本笔记为笔者自学网课做的一些重要步骤和理解的记录,目的是在需要的时候可以快速回顾,并记录自己学习的一个过程.因此有些内容可能不完整,可以根据自己需求去补充相应的笔记.如果你恰好看到了我的 ...

  7. 史上最全的机器学习深度学习面经总结

    史上最全的机器学习深度学习面经总结 提示:19年之后的面经,扩大了范围包括了cv,推荐,语音等面经中的知识点, 同时增加了那三本面经书的内容一些github上一些比较火的项目,大部分问题是重复的,去重 ...

  8. [转载]机器学习深度学习经典资料汇总,全到让人震惊

    自学成才秘籍!机器学习&深度学习经典资料汇总 转自:中国大数据: http://www.thebigdata.cn/JiShuBoKe/13299.html [日期:2015-01-27] 来 ...

  9. 2018年机器学习深度学习资料 全新汇总(不断更新),希望看到文章的朋友能够学到更多

    向AI转型的程序员都关注了这个号??? 大数据挖掘DT数据分析  公众号: datadw 注:机器学习资料篇目一共500条,篇目二开始更新 本文提到链接 请查看原文  https://github.c ...

最新文章

  1. IIS 部署 node.js ---- 基础安装部署
  2. Python学习基础必备知识点:字典dict详解
  3. 洛谷 P2296 寻找道路
  4. 小目标检测、图像分类、图像识别等开源数据集汇总
  5. 0也显示曲线 mpchart_BenQ 明基专业摄影显示器SW270C开箱评测体验
  6. 如何搭建lamp(CentOS7+Apache+MySQL+PHP)环境
  7. C++ newdelete
  8. 利用 Zabbix 监控 mysqldump 定时备份数据库是否成功 | 运维进阶
  9. IDEA(2018版)实用快捷键整理
  10. maven pom聚合与继承
  11. 第五十五节,IO多路复用select模块加socket模块,伪多线并发
  12. 地图投影——高斯-克吕格投影、墨卡托投影和UTM投影
  13. FMEA软件测试工资,目前运用的比较广泛的是【FMEA不良模式效应分析】,很多人都不知道还有...
  14. 2021-4-25科学计算器开高次根号
  15. Easy Touch 5 简单使用
  16. Android API与系统版本的关系
  17. 微信最新数据:每天有 10.9 亿人打开微信,7.8 亿人进入朋友圈
  18. AI 开发者被疯抢,华为做了什么?
  19. 1375. 至少K个不同字符的子串
  20. 商城系统面试题(二)

热门文章

  1. Qt5:为窗口 创建工具栏 toobar
  2. IE 9 Preview尝鲜
  3. Java类加载文章1(z)
  4. 软件项目获取用户需求的沟通技巧(摘自IT168技术频道)
  5. 【2019-05-31】生活仪式
  6. 复制介绍、复制的实用价值
  7. mybatis学习笔记
  8. Shiro内置的FilterChain
  9. Codeforces 486D D. Valid Sets
  10. iPhone屏幕知识点