最近在研究机器学习,随手将学习的过程记录下来,方面自己的学习与回顾

1. 机器学习是什么?

机器学习(Machine Learning,ML)是专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能的一门科学技术。

它使用计算机技术,应用微积分、概率论、统计学、逼近论、凸分析、算法等多种不同的理论与学科,针对分析目标建立有针对性的数据模型,通过对过往历史数据的学习(分类、回归、聚类等),完成基本算法模型,并能通过后续持续的学习(数据输入),在将杂乱的数据转换(输出)成有用信息的同时,还能不断优化改造自身。

2. 机器学习能解决什么问题?

对于学习,人的学习过程,是通过观察(输入),根据过往经验对观察到的内容进行思考(处理),最后得出结论(输出)的过程。

而机器学习是计算机利用已有的数据(一般是海量数据),得出了某种模型(算法模型),并利用此模型预测未来的一种方法。

机器学习主要解决的问题可以归纳为:优化,预测,相关性。可以说,只要是涉及到优化,预测,个性化相关的问题,机器学习和深度学习都可以处理。

比如说,我们去买百香果吃,我们没有买百香果的经验,不知道那些是甜的那些是酸的,然后我们买了一大堆回来,有大的、小的、轻的、重的、红的、紫的、白的、黄的、果皮光滑的、干皱的...然后每一个都尝一便,最后发现,百香果原来有两大类,紫红和黄白两类,紫红类的,果皮越深(越紫越黑)的越甜,黄白类的越黄越甜,跟大小无关,跟果皮的光滑度无关,而同样大小,越重的果汁越多。黄白类的比紫红类的果子甜度更高一些。那么下次去买的时候,自然就懂得如何挑选了。

而机器学习跟买水果的过程类似,通过建模(对水果甜度的判断)、设计策略(针对百香果不同的形状特性)和算法(品尝百香果,得出酸甜结论),然后输入大量数据(一大堆不同种类与特征的百香果)进行训练,最后学会判断的过程(知道什么类型的百香果比较甜)。模型建好后,就可以针对更多的数据进行测试并输出结果(下次去买水果直接挑选学习后的水果类型,可以直接根据特征判断酸甜度),而这些结果也将不断的修正模型(买回来后继续品尝,观察酸甜度,继续总结经验,调整判断方法),提升模型的准确率,更好的帮我们预测数据。

当前,机器学习广泛应用于搜索引擎、垃圾邮件处理、广告推荐、数据挖掘、图像识别、自然语言处理、生物特征识别、医学诊断、证券投资分析、DNA序列测序、语音和手写识别、机器人运用等诸多领域,且应用的领域越来越广泛。

3. 学习机器学习,需要具备什么能力?

入门学习机器学习,只需要掌握下面这些能力:

  • 了解一些数学基础常识

  • 掌握一门编程语言(最好是python)

对于入门来说,不一定要具备了所有的数学理论基础才能开始,不具备这些知识并不代表不能灵活操作各个机器学习库,只是有些算法的理解会更困难。这些基础理论在后续需要慢慢补上,它们关系到你在AI领域天花板的高度。而直接从实践入手,会更容易理解算法,对后续算法的深入学习也有很大的帮助。

而想进阶成为专家,除了需要加强数学基础理论(高数、线性代数、统计学、概率论、信息论等数学基础)的学习外,还需要学习大数据相关的知识与技能(如:Hadoop、HBase、Spark、kafka、Flume、Sqoop、Storm等)。然后根据发展方向,有针对性的学习NLP、神经网络等内容,往更多更专业的领域深入学习。

4. 怎么学?

学习机器学习,需要分阶段循序渐进学习,尽量不要一下子就深入算法的推导中(除非你的数学理论非常扎实),不要试图掌握所有的相关数学知识再开始学习,否则很容易从入门到崩溃,从崩溃到放弃。

对于初学者,建议从这几方面来学习:

  1. 首先了解什么是机器学习,以及机器学习的相关理论常识,对机器学习有个总体的了解与认识。

  2. 知道有哪些学习资源,了解这些资源哪些适合初学者。

  3. 大体了解机器学习的技术栈,了解涉及哪些知识体系,然后与自己的技术体系进行比较,了解学习方向,并做好长期学习的计划与心态。

  4. 然后花些时间,了解机器学习的常用专业术语,大概了解这些专业名词的意思,方便后续学习时更容易理解学习内容(不需要全部了解,只需要大体知道是什么就行了,在学习机器学习的过程中会不断的加深学习与理解)。

  5. 接着直接进入学习,可以学习《机器学习实战》这本书,也可以学习ApacheCN分享出来的文本或视频教程,学习各种机器学习算法,先实践再到理论。

  6. 入门后再根据所要用到的基础理论或机器学习相关算法和知识点,再针对性的学习,逐步提高。

参考资料:

https://www.cnblogs.com/subconscious/p/4107357.html

https://github.com/apachecn/AiLearning/blob/master/docs/ml/1.%E6%9C%BA%E5%99%A8%E5%AD%A6%E4%B9%A0%E5%9F%BA%E7%A1%80.md

相关推荐

机器学习(02)——学习资料链接

基于自动机器学习的心脏病预测模型(1)

机器学习:10+分类算法汇总学习

【华为云技术分享】机器学习(01)——机器学习简介相关推荐

  1. 【华为云技术分享】三大前端技术(React,Vue,Angular)探密(下)

    [华为云技术分享]三大前端技术(React,Vue,Angular)探密(上) [Angular] Angular(通常被称为 "Angular 2+"或 "Angula ...

  2. 【华为云技术分享】“技术-经济范式”视角下的开源软件演进剖析-part 1

    前言 以互联网为代表的信息技术的迅猛发展对整个经济体系产生了巨大的影响.信息技术的发展一方面使知识的积累和传播更加迅速,知识爆炸性的增长:另一方面,使信息的获取变得越来越容易,信息交流的强度逐渐增加, ...

  3. 【华为云技术分享】“技术-经济范式”视角下的开源软件演进剖析-part 3

    4. 微观层面 4.1 个体动机 在开源软件发展之初, 商业组织的投入很少甚至没有, 完全是靠Richard Stallman 或者 linus Torvalds 这样的个人在努力推动开源软件艰难前行 ...

  4. 【华为云技术分享】直播回顾丨激发数据裂变新动能,HDC.Cloud云数据库前沿技术解读

    3月24日14:00-17:00,HDC.Cloud开发者沙龙系列云数据库专场直播线上开启,此次华为云数据库通过三场直播从NoSQL数据库新技术.数据库迁移.行业解决方案等方面对云端数据库进行深度解读 ...

  5. 【华为云技术分享】基于自动机器学习的心脏病预测模型(1)

    前言 Technology developed using artificial intelligence (AI) could identify people at high risk of a f ...

  6. 机器学习笔记(九)---- 集成学习(ensemble learning)【华为云技术分享】

    集成学习不是一种具体的算法,而是在机器学习中为了提升预测精度而采取的一种或多种策略.其原理是通过构建多个弱监督模型并使用一定策略得到一个更好更全面的强监督模型.集成学习简单的示例图如下: 通过训练得到 ...

  7. 【华为云技术分享】用人工智能技术推动西安民俗文化,斗鱼超管团队有一套

    摘要:AI成为传统文化发展的助推器,助力传统文化朝着大众化.数字化.个性化.精准化方向发展,赋予传统文化新的生机,延续传统文化新的生命."斗鱼团队"从五个方面进行阐述"纵 ...

  8. 【华为云技术分享】华为专家亲述:如何转型搞 AI?

    前言 参考塞缪尔. 约翰逊(18 世纪英国文学评论家.诗人,著有<英语大辞典>.<莎士比亚集>)的思路,"当一个人厌倦了学习技术,那他肯定也厌倦了 IT 行业,因为只 ...

  9. 【华为云技术分享】华为云 DevCloud 首席产品布道师:AIOps 不是 DevOps 的下一代

    近年来,将软件开发流程迁移到云上成为开发领域的一大趋势.随之而来地,人们会关心,和本地开发方式相比,云上开发能为企业带来哪些益处?能否保证安全.可信?未来它还将与 AI 技术碰撞出怎样的火花?在 QC ...

  10. 【华为云技术分享】在 K8S 大规模场景下 Service 性能如何优化?

    摘要:Kubernetes 原生的 Service 负载均衡基于 Iptables 实现,其规则链会随 Service 的数量呈线性增长,在大规模场景下对 Service 性能影响严重.本文分享了华为 ...

最新文章

  1. 中国HBase技术社区第一届Meetup资料大合集
  2. mongooseim xmpp 服务器docker 安装试用
  3. Docker中的“公开”和“发布”有什么区别?
  4. python 公钥解密
  5. 深度学习中几种常见的激活函数理解与总结
  6. 用拦截器+注解+cookie进行简单限流访问案例
  7. iis下安装Memcache
  8. Redis 高负载下的中断优化
  9. JIRA和Confluence更改JVM内存大小解决访问打开缓慢问题
  10. 【机器人】项目疑难杂症
  11. 模拟支付宝服务窗环境
  12. r-cnn 行人检测_了解对象检测和R-CNN。
  13. 11 week blog
  14. SQL Server 2008超详细安装教程附下载链接
  15. word2007导出pdf带书签
  16. GCD中的dispatch_barrier_async函数的使用(栅栏函数)
  17. Windows下安装Tensorflow-Slim(待续)
  18. 高版本node,无法编译程序,删除所有文件
  19. 金蝶系统服务器名称填什么,金蝶怎样输入服务器地址
  20. python可以引流吗_你都用 Python 来做什么?

热门文章

  1. CAN笔记(3) 错误状态
  2. linux tbb 安装_Ubuntu18.04 GCC9 安装
  3. SP1557 GSS2 - Can you answer these queries II
  4. HTML5+CSS+JQuery 实现简单的进度条功能
  5. 算法篇【枚举2 -- 生理周期】
  6. Java——面向对象进阶(final关键字,static关键字,匿名对象,内部类,四种访问修饰符,代码块)...
  7. springMVC中数据流解析与装载
  8. ASP.NET页面与IIS底层交互和工作原理详解 (二)
  9. 今日登陆sourceforge后发现的灵异现象
  10. leetcode 84 python