今天是一点经验分享,包大人当初用这个路子入门机器学习的。

前言

回顾了下我当初入门机器学习方式,发现还是有些特点的。因为是科班出身,所以是那种稳扎稳打,自顶向下,理论结合实践的方式,比较注重用代码实现去理解原理。代码有个好处就是不会骗人,光看理论有种我明白了,但是很模糊,如果结合代码就非常清晰了。用两个字说就是“扎实”


主要分为原理入门,编程理解,实战应用,三个步骤。其中非常强调过程中的正反馈,和优质的资源。正反馈是长久坚持的动力来源。优质资料是高效正确的保证。

比较反对下面这样囫囵吞枣,良莠不齐,就想着21天从入门到精通的方式。

第一、反对上来就给你推荐python,sklearn,pandas之类的。这些东西往往把细节都藏起来了,容易变成调包侠。

第二、 不推荐任何国内的非知名大学的视频教程。大部分的东西不是抄就是质量太差,有吴恩达的公开课不看去买网课,留着钱买个大鸡腿吃不好吗。

第三、不推荐任何上来就是各种花里胡哨从开发到部署的实战项目,抓住人就想心急吃热豆腐的心理贪图你的钱包。

第一阶段:原理入门

目标是搞清楚机器学习的基本概念和基本的算法原理。这个阶段的正反馈来自于新知识的获取,原理的理解。不要好高骛远。下面介绍几种入门方法,分别对应看书入门党,看视频入门党,有一些精选的优质资源推荐给初学者。推荐的资源,周志华《机器学习》,李航《统计学习方法》 Peter Harrington 《机器学习实战》吴恩达 Coursra 机器学习公开课

首先看书入门党,周志华和李航老师的西瓜书和统计学习方法都可以,可以快速地看完前几章,不要具体到算法,如果你愿意,看完逻辑回归就可以了,首先明白机器学习问题的定义,其次明白几个关键的名词,训练验证测试,偏差方差,样本,特征,标签。然后去看什么是监督学习什么是无监督学习,大概了解了这些之后,再到具体的算法。再推荐一本书《机器学习实战》绿皮书,这些书的特点就是原理讲的很明白,《机器学习实战》所有的算法都用代码实现了一遍,逻辑清晰很好理解,比那些用sklaern的书强一万倍。

看视频入门党,推荐吴恩达 Coursera 上的《机器学习》,吴恩达老师设计的课程已经非常适合入门了,侧重原理,逻辑清楚,机器学习的细节也面面俱到。

经过上述阶段,你大概对机器学习要解决的问题,使用的方法和适用场景都有所了解了,这时候,你大概对算法的原理也都八九不离十,但是学习原理总是枯燥的,不过一定要坚持下来,千万不要在这个阶段满足于调包。

第二阶段:在编程中理解

目标是能够自己动手实现算法的细节而不是用sklearn去调包。正反馈是自己动手从头正确实现机器学习算法。 推荐资源 Peter Harrington 《机器学习实战》吴恩达 Coursra 机器学习公开课编程作业。

这里推荐吴恩达老师机器学习课程的作业,不需要把每个算法都实现一遍,但是要在实践中去理解机器学习的基本算法套路,比如梯度下降是怎么做的,链式法则怎么用程序表达。还有就是《机器学习实战》的配套代码,这本书的最大好处是让你能够用最基本的python语法,从底层上让你构建代码,实现我们常说的比如邮件过滤,数据分类的应用。

很多时候你要写最基本的代码和结构去做这些工作,而不是像sklearn去调用fit 和predit,你能实现算法的底层原理,知道决策树的分割增益计算如何写代码,梯度下降如何写代码,知道机器学习是如何从0到1实现的。

不过这本书比较老旧了,重点也不是讲解理论方面的东西,可以当成第二个阶段的教材,和第一阶段互补。

另外。如果你是NLP方向的同学,可以看一下词向量GloVe的代码实现,为什么推荐GloVe的代码,他是一个用纯c语言写的机器学习做矩阵分解来求解词向量的程序,包含实现随机梯度下降,损失函数定义,数据并行处理等基本的要素,是麻雀虽小,五脏俱全,代码逻辑清晰,涉及到机器学习的方方面面,而且,毫无调包,代码量不大,很容易看懂。

第三阶段:实战应用

目标是把机器学习应用到实际问题中,加深对算法的理解。正反馈来自于使用机器学习工具来解决实际问题。推荐资源Kaggle。

这时候,你对机器学习的原理,实现都有了解了,但是机器学习毕竟是一门应用的科学,我们通过在实战中学习机器学习。所以这个阶段非常适合打比赛。这里比较推荐Kaggle平台,不推荐国内的竞赛平台,除非你想给自己添堵,被排行榜上各种骚操作吓呆。至于怎么玩kaggle,推荐kaggle kernel上的开源讨论,以及一些比较好的Grand Master的分享。

后话

上面三个阶段,在具体的知识点上可以互相交叉。比如,你看完了逻辑回归,动手实现了一下,然后上kaggle做了一个数据集的任务。不是说非得把所有的长篇大论看完了,这样能更有利于你学习。

如果你有什么特别好的资源推荐,或者入门方法,欢迎放到评论区~

往期精彩回顾适合初学者入门人工智能的路线及资料下载机器学习及深度学习笔记等资料打印机器学习在线手册深度学习笔记专辑《统计学习方法》的代码复现专辑
AI基础下载黄海广老师《机器学习课程》视频课黄海广老师《机器学习课程》711页完整版课件

本站qq群955171419,加入微信群请扫码:

【机器学习】扎实入门机器学习的路子相关推荐

  1. Steam高赞游戏入门机器学习!不写代码,人人可玩,又能吸猫,汉化版已推出...

    栗子 乾明 发自 凹非寺  量子位 报道 | 公众号 QbitAI 撸猫.咖啡,玩游戏. 但我其实是在入门机器学习. 2019年最简单有趣的入门方式,就在这里: Steam高赞游戏,极度易上手. 现在 ...

  2. 机器学习从入门到进阶✅

    1. 放弃海量资料!!! 没错,就是放弃海量资料!在我们想要入门机器学习的时候,往往会搜集很多资料,什么 xx学院机器学习内部资源.机器学习从入门到进阶百 G 资源.xx 人工智能教程,等等.很多时候 ...

  3. 机器学习简易入门-附推荐学习资料

    目录 (1)机器学习正规学习路线 (2)机器学习快速入门 (3)总结 感谢黄海广博士的分享 原创: 机器学习初学者 机器学习初学者 今天 机器学习如何入门?目前没有明确的答案.本站面向广大初学者,推荐 ...

  4. 靠谱的快速入门机器学习和深度学习路线

    『运筹OR帷幄』原创 作者:霍华德 编者按: 入门机器学习和深度学习并不是一件容易的事情.需要学习大量的知识,初学者常常会迷茫不知所措.现在我们给你带来一篇纯干货,帮助你入门机器学习和深度学习. 什么 ...

  5. 课程 | 中科院教授带你快速入门机器学习

    机器学习,说简单就简单,说难还真难,对于还没入行的同学,大概最难的是如何入门机器学习?应该掌握哪些知识?看什么书最高效?如何避免绕弯?如何利用已有基础进一步提高水平?

  6. 新书上市 | 数学不好,Python不行,还能入门机器学习吗?

    没错,图灵君又来安利好书了! 什么书?机器学习?机器学习的书已经很多了,这本有啥特别的吗? 当然有. 话说有位日本网友,买了40多本数学和机器学习相关的书,愣是没有学会,直到遇到了这本,那叫一个相见恨 ...

  7. 干货丨入门机器学习,从搞懂这8大经典算法开始

    在机器学习领域,"没有免费的午餐"是一个不变的定理.简而言之,没有一种算法是完美的,可以作为任何问题的最佳解决方案.认清这一点,对于解决监督学习问题(如预测建模问题)尤其重要.我们 ...

  8. 文科生如何入门机器学习:先看看这篇零基础教程,再多算几遍吧

    晓查 发自 凹非寺 量子位 出品 | 公众号 QbitAI AI技术变得越来越热门,很多人开始转行进入这一领域,其中当然也不乏文科生.他们在普遍缺乏大学数学知识的情况下,就不能入门机器学习了吗? 最近 ...

  9. ML:推荐给小白入门机器学习一系列书籍

    ML:推荐给小白入门机器学习一系列书籍 目录 一.外文版 二.中文版 一.外文版 Christopher M.Bishop,  Pattern Recognition and Machine Lear ...

最新文章

  1. php进攻教程,如何对PHP程序中的常见漏洞进行攻击(下)_php基
  2. 2440裸机编程之四 外部中断
  3. Py之Matplotlib:python包之Matplotlib库图表绘制经验总结(中英文字体修改、横坐标文字进行横/纵向显示、控制坐标轴范围等)之详细攻略
  4. 数学分析原理 定理 6.12
  5. Linux是实时系统还是分时操作系统?
  6. 时间轴app哪个好?可以记录自己过去经历的时间轴便签
  7. 【AI初识境】从3次人工智能潮起潮落说起
  8. 技校自我鉴定范文计算机600字,技校自我鉴定100字范文18篇
  9. 51单片机汇编语言点亮一位数码管,并计时(超详细分析汇编语言)
  10. 更改C盘用户目录下的文件夹名称
  11. excel打开密码忘记了_行李箱密码忘记了怎么办?教你3招轻松打开
  12. linux中竖线'|',双竖线‘||’,和的意思
  13. 2006年美国商业科技创新250强-----SUN公司第六!
  14. 网吧大哥服务器维修,《绝地求生》服务器又崩溃!网吧老板快要哭了
  15. linux解压lzma,如何获得LZMA2文件的解压缩大小(.xz/liblzma)
  16. cocos《破碎骑士》开发日志
  17. 社区服务开启“云”智慧社区时代,CDN高防能否成为服务器的源动力呢?
  18. 树莓派实验室python人脸识别_使用树莓派进行简易人脸识别
  19. 中国省份名字的由来!
  20. NOIP2012 国王游戏 题解

热门文章

  1. JavaScrip调用腾讯地图
  2. 1.1.3 以Self Host方式寄宿Web API
  3. elk-logstash时区问题
  4. 利用ueditor保存到mysql数据库时出现乱码
  5. IOC容器特性注入第一篇:程序集反射查找
  6. Linux下批量添加用户的两种方法
  7. SDUT 2133 数据结构实验之栈三:后缀式求值
  8. ASP.NET多语言网页设计
  9. 2021-11-09类作为成员变量类型
  10. 遇到tensorflow has no attribute 问题