时间过得很快,转眼间就要到了准备毕业论文的时候了。研究生的毕业论文不能像本科一样简单的发现规律,将规律表达出来便可。研究生的论文更像是一种通过发现现实问题,进行深入研究后,再将现象提炼出来进行规律总结最后对问题提出更为科学的解决方案。重点在这个提炼与应用的过程,也是很痛苦的一个过程。需要查看大量的文献,了解国际最新研究动态。运用很多较为先进的方法进行操作。特别是瞻仰过几篇师兄的毕业论文之后,发现我现在掌握的知识还远远不够。经过导师的点播,我决定往机器学习方面靠。这也是能够很好挖掘论文深度的一个方面。对我来说也是打开了一个新的领域。以下便是我学习了机器学习一段时间后的一个认识。

所谓机器学习其实也可以叫做统计学习,主要以计算机和网络为平台,对大量数据进行研究,目的是发现规律并进行预测分析的过程。这其中会用到很多的方法,也是机器学习的核心所在。何为学习,Herbert A.Simon说过:如果一个系统能够通过执行某个过程改进它的性能,这就是学习。

学习机器学习的总体目的便是考虑运用什么样的模型对数据进行学习,使得得到的模型能够更好的对数据进行预测,提高学习效率。方法有很多,模型也很多。通过一段时间的学习,所谓机器学习的主要过程可提炼为以下几点:

①得到一个有限的训练数据集合

②确定包含所有可能的模型的假设空间,即学习模型的集合

③确定模型选择的准则,即学习的策略

④实现求解最优模型的算法,即学习的算法

⑤通过学习方法选择最优模型

⑥利用学习的最优模型对新数据进行预测分析

机器学习方法的三要素为:模型(模型的假设空间)、策略(模型选择的准则)、算法(模型学习的算法)

对于学习模型的好坏也有这一套评判方法,比如0-1损失函数、平方损失函数、对数损失函数、绝对损失函数等。通过这些判断预测的好坏,便有了经验风险最小化的方法即:

这个判断方法需要实验样本比较大的情况,不过一味的最求经验风险的最小化会存在过拟合现象的发生,简单的说模型所含的参数过多,对已知的数据预测的很好,但是对未知的数据预测很差。达不到我们想要的结果。于是便有了结构风险最小化的方法在后面加了个正则化项

目的便是选择经验风险和模型复杂度同时较小的模型。

其实对于模型的选择问题除了正则化的处理还有交叉验证、S折交叉验证、留一交叉验证以及学习泛化能力等。

对于交叉验证是通过随机将数据切分成三部分:训练集(训练模型)、验证集(选择模型)、测试集(最终对学习方法评估);该方法使用于数据充足的情况。

比如简单交叉验证:通过随机将数据分为两部分(训练集与测试集)然后在训练集中进行训练得出模型再在测试集中进行模型评判选择

应用最多的便是S折交叉验证了。通过随机将已知数据分为大小相同的S个子集,而后利用S-1个子集为训练模型,省下一个为测试模型。将这一过程对可能的S中选择进行重复,最后选出这S个测评中平均误差最小的模型。

作为S折交叉验证的特殊情况留一交叉验证用的极少,意思就是S=N的情况,N是给定数据集的容量。

学习的泛化能力:通常将学习方法对未知数据的预测能力称为泛化能力。说到这就不得不说一下泛化误差这东西了,泛化误差:选定模型对未知数据预测的误差,其实就是所学习的模型的期望风险。

监督学习可分为生成方法和判别方法两种。

生成方法:有数据联合概率分布P(X,Y),然后求出条件概率分布P(Y|X)作为预测的模型。公式表示为:个人感觉怎么这么的像以前学的概率论呢?可能就是吧。♪(・ω・)ノ它的特点是学习收敛快、能够对存在隐变量进行学习。

判断方法:由数据直接学习决策函数f(X)或者条件概率分布P(X|Y)作为预测的模型。特点是学习准确率高、可对数据进行抽象,定义特征并使用特征,可以简化学习问题。

监督学习主要应用在三大问题上:分类问题、标注问题和回归问题。

分类问题:重在分类二字将结果进行分类,对数据进行划分;主要包括学习(根据已知的训练数据集利用有效的学习方法学习一个分类器)和分类(利用学习的分类器对新的输入实例进行分类)两个步骤;常用的评价指标为精确率P=TP/(TP+FP)与召回率R=TP/(TP+FN)。2/F1=1/P+1/R.

TP--将正类预测为正类数

FN--将正类预测为负类数

FP--将负类预测为正类数

TN--将负类预测为负类数

标注问题:分类问题的一个推广,输入为观测序列,输出为标记序列或状态序列。

回归问题:用于预测输入变量和输出变量之间的关系。表达从输入变量到输出变量之间的映射函数类似于函数拟合。

可以说:输入变量与输出变量均为连续变量的预测问题为回归问题;输出变量为有限个离散变量的预测问题为分类问题;输入变量与输出变量均为变量序列的预测问题称为标注问题。

总体感受:很是枯燥乏味。可能是太难了吧,为了毕业,加油干吧!O(∩_∩)O哈哈~确实开阔了自己的视野。

学习机器学习总体感受相关推荐

  1. 如何系统学习机器学习?

    机器学习是人工智能下一个比较广泛的分支,涉及了很多交叉的领域如NLP自然语言处理.计算机视觉Computer Vision等等.简单来说,机器学习ML就是通过训练计算机来模拟人类的学习行为,从而进行预 ...

  2. 如何学习机器学习、看待算法竞赛?粉丝精选留言

    在前几日的赠书活动中,看到大家的积极留言,非常用心,可以看出对机器学习的热爱.经授权,CV君特意将一些52CV粉丝对学习机器学习.参与算法竞赛的看法.理解与经验放出来,与大家分享,值得收藏细品,希望他 ...

  3. 工程师也该学习机器学习了!

    一. 程序员是一个知识更新较为迅速的一个职业,这个行业的知识的更新速度,有的时候会超过你的学习速度.大部分的人都在不断的更新自己的知识体系,这里笔者要向读者安利一下机器学习(包含深度学习)的重要性,以 ...

  4. 工程师如何学习机器学习算法

    PS:CSDN的格式乱了,markDown的格式居然不起作用...改了不见任何效果,无力吐槽..... ###1.前言 - 程序员是一个知识更新较为迅速的一个职业,这个行业的知识的更新速度,有的时候会 ...

  5. 欢迎大家和我一起从零开始学习机器学习,和你一样的初学者的学习周刊,不再担心学不懂机器学习,最简单最适合新手的博客开始了!

    和我一起从零开始学习机器学习 我是从零开始学习机器学习,我会用最简单那明白的语言来给像我一样从零开始学习机器学习的人讲述怎么学习机器学习,我看了那么多的博客发现并不适合新手观看,那么我会每个周发布一片 ...

  6. 学习机器学习,究竟是理论重要,还是公式推导重要?

    随着近几年机器学习的火爆,其从业门槛也越来越高,以至于出现面试者需要现场手推对数几率回归和手写反向传播代码的情况.不论是对机器学习本身的研究,还是岗位的需求,都需要我们对算法有很深的了解,对公式本质有 ...

  7. Python之GUI:基于Python的GUI界面设计的一套AI课程学习(机器学习、深度学习、大数据、云计算等)推荐系统(包括语音生成、识别等前沿黑科技)

    Python之GUI:基于Python的GUI界面设计的一套AI课程学习(机器学习.深度学习.大数据.云计算等)推荐系统(包括语音生成.识别等前沿黑科技) 导读 基于Python的GUI界面设计的一套 ...

  8. 吴恩达登录知乎,亲自回答如何系统学习机器学习

    如何系统地学习机器学习?知乎里有很多回答,近日,吴恩达老师亲自在知乎回答了这个问题: 作者:吴恩达 链接:https://www.zhihu.com/question/266291909/answer ...

  9. 吴恩达入驻知乎首答:如何系统学习机器学习?

    最近在知乎圆桌里看到吴恩达的回答,[如何系统学习机器学习?] 颇为惊喜,仿佛看到了知乎刚成立时的样子,请各个行业大佬来分享专业知识. 该回答目前已经有三千多赞,评论区也相当火爆,一片膜拜之声. 吴恩达 ...

  10. 学习机器学习的项目_辅助项目在机器学习中的重要性

    学习机器学习的项目 提示与建议 (Tips and Advice) There are a few questions that are asked frequently by machine lea ...

最新文章

  1. 路由跟踪工具0trace
  2. 开发日记-20190409 关键词 理想activity模型
  3. (转)性能分析之-- JAVA Thread Dump 分析综述
  4. 再聊机器人设计:如何加速开发流程?
  5. [CQOI2017] 老C的键盘(树形dp + 组合数)
  6. php cpu缓存 执行 代码,缓存PHP页面的代码,可以减轻CPU和MYSQL负担
  7. 图解,C语言数据结构,插入排序
  8. 如何用anaconda创建python项目_PyCharm+cmd中使用Anaconda 与 新建Python环境(Windows)
  9. 快捷键截屏_Windows10自带截屏快捷键使用方法大全
  10. elipse开发android 如何查看报错信息
  11. C++数据库编程简介
  12. java基础考试_Java基础试题及其答案
  13. wps压缩word文档方法
  14. 《墨菲定律》读书笔记之第一章——成功学的秘密
  15. 桌面自动化实现原理-RPA+
  16. 详解关于卫星影像(卫星地图)的一些常见问题
  17. Linux 之管道通信
  18. 启动计算机实现5秒开机,电脑3秒开机,怎么做到的?
  19. 1、玩转树莓派音频——DIY具有输入输出的声卡(非USB)
  20. jsp免费虚拟空间 jhost邀请码

热门文章

  1. 迅雷“应版权方要求,文件无法下载”完美解决方法!(¥28)
  2. 打印机出现另存为xps_打印机打印文件时弹出另存为xps/pdf该怎办?
  3. TypeError: can only concatenate list (not “int“) to list
  4. galton板matlab,Matlab实现Galton板的动画演示
  5. Android编译环境搭建
  6. windows 设置目录不可执行程序
  7. bootstrap 检验 法 原理_三种中介效应检验方法及操作步骤
  8. 给出n元置换群线性表示的一种方法
  9. 高考数学圆锥曲线总结贴+杂题巧解
  10. trackpoint_如何在戴尔笔记本电脑上禁用TrackPoint鼠标按钮?