入行机器学习有一年多了,做过大大小小的机器学习项目,参加数据竞赛等实践活动,从最初的懵懵懂懂到现在逐步的深入,也渐渐的有了很多的体会和理解,本篇文章主要来阐述机器学习的知识体系,以让更多人明白机器学习应该怎样学习、需要学习什么?这些问题就是本篇文章的主要讨论的内容,下面开始进行详细介绍。

## 先对本篇文章的目录做个介绍:

1. 1.机器学习术语

1. 2.常见算法类型

1. 3.评估方法和指标

1. 4.性能优化和超参数调优

## 1.机器学习术语

接下来正式介绍机器学习术语。机器学习术语作为作为最基本的常识问题,为了更好的学习和理解机器学习算法,识记和理解相关术语是非常必要的。术语常见的有特征、标签、泛化能力、有监督与无监督学习、过拟合、欠拟合、鲁棒性、分类、回归、聚类与降维、集成学习等。

在这里只介绍机器学习、特征、标签、有监督与无监督学习这几个术语,其它术语在后面会一一介绍。

**(1)机器学习**

机器学习是指根据历史数据,使用某种算法或者规则从数据中寻找规律,以达到预测未知的事情,这就是通俗的机器学习概念

**(2)特征**

特征是指与事物本身关系紧密的属性,通俗来讲特征是一组自变量数据。

**(3)标签**

标签是指一组属性特征所对应的标志值,通俗来讲标签是一组应变量数据。

【福利1:如何快速且深刻的区别和理解特征与标签的含义、区别?】

福利1:例如关系式:y=x1+x2+x3,y就是标签,而x1、x2、x3则是特征,下面将特征与标签以二维向量的形式展示,以加强理解:

x1(特征) x2(特征) x3(特征) y(标签)

样本1 2 1 5 8

样本2 5 6 3 14

… … … … …

**(4)有监督与无监督学习**

有监督学习是指算法在训练过程中,不仅数据特征参与训练,而且数据标签也参与到训练中以辅助特征的训练学习。

无监督学习是指算法在训练过程中,只有数据特征参与训练学习,而数据标签是不确定或未知。

【福利2:如何快速理解与区别有监督、无监督学习呢?】

福利2:有监督学习=特征+标签;无监督学习=特征。

## 2.常见算法类型

机器学习常见的算法类型有:分类、回归、聚类、降维。

**(1)分类**

分类算法是指针对标签为离散型数据的一类问题进行算法训练,从而预测并进行分类的过程。分类算法常见的有:K近邻算法、朴素贝叶斯、逻辑回归、支持向量机、决策树(在这里先不列出集成学习之类的分类算法)。

**(2)回归**

回归算法是指针对标签为连续型数据的一类问题进行算法训练,从而预测并进行拟合的过程。回归算法常见的有:线性回归、岭回归、lasso回归。

**(3)聚类**

聚类算法是指利用事物特征的相似度进行聚类划分的过程。比较常见的聚类算法是k-means。

**(4)降维**

降维是指将高维数据低维化的过程,旨在通过少量特征的信息来代替总体特征的信息。常见的是主成分分析(PCA)。

## 3.评估方法与指标

性能评估是指算法进行训练学习之后,为了验证算法的可靠性,需要性能评估方法和指标来衡量算法的优劣情况。

**(1)评估方法**

评估方法常见的是:holdout验证、k-fold交叉验证。

**(2)评估指标**

分类评估指标主要有:准确率、混淆矩阵、精确率、召回率、f1分数、auc值以及P-R曲线、roc曲线。

回归评估指标主要有:绝对平均误差、均方差、均方根误差等。

## 4.性能优化和超参数调优

性能优化是指对算法模型进一步改进,以得到更为理想的预测效果。性能优化常见的有梯度下降、超参数调优、集成学习算法、正则项惩罚、有效特征选择等。

本篇机器学习整体知识体系介绍完毕,欢迎留言交流学习,每天学习成长一点点!!!

机器学习与知识发现_01机器学习算法整体知识体系与学习路线攻略相关推荐

  1. JVM整体知识体系深度学习__JVM与Java体系结构【持续更新】

    JVM整体知识体系深度学习 一.JVM与Java体系结构. 前言 是否遇到过一下问题. 运行的线上系统突然卡死,系统无法访问,甚至直接OOM[OutOfMemory 内存溢出] JVM GC问题 新项 ...

  2. 【技术总结】大数据开发模块化知识体系、学习路线及对应的资料推荐

    〇.概述 1.常用网站 2.常用资料 一.环境 Linux Shell Git Maven Docker K8S Rancher 二.数据库 MySQL Oracle Sql Server Postg ...

  3. 重构机器学习算法的知识体系 - 《终极算法》读书笔记

    2019独角兽企业重金招聘Python工程师标准>>> 最近有幸从图书馆借阅了Pedro Domingos的<The Master Alogrithm>一书,这本书的中文 ...

  4. 人工智能产品经理知识体系和学习计划

    人工智能(Artificial intelligence)产品经理知识体系及学习计划 学习目标 具备成为人工智能产品经理的能力(To be a AI product manager not AI sc ...

  5. 嵌入式系统的知识体系、学习误区及学习建议

    嵌入式系统的知识体系.学习误区及学习建议 1.嵌入式系统的知识体系     嵌入式系统的应用范围可以粗略分为两大类:电子系统的智能化(工业控制.现代农业.家用电器.汽车电子.测控系统.数据采集等),计 ...

  6. 线性代数学习全攻略(内附机器学习路径图)

    高考刚结束,之前不少人让我推荐专业,对理工科的同学,我一般会说,如果你没有特别执着的专业方向,就报数学系好了. 其实小时候我也想不明白学好数学有什么用,直到后来学了工程数学之后,才意识到原来数学可以应 ...

  7. 10 门必修的机器学习名校公开课,旨在完善你的 AI 学习路线!

    点击上方"AI有道",选择"星标"公众号 重磅干货,第一时间送达 编辑 | 红色石头 本文将给大家介绍机器学习和数据科学领域 10 个全球知名的免费公开课!这些 ...

  8. 大数据怎么学习:大数据学习的关键技术知识体系、学习路径和误区

    由于大数据技术涉及内容太庞杂,大数据应用领域广泛,而且各领域和方向采用的关键技术差异性也会较大,难以三言两语说清楚,本文从数据科学和大数据关键技术体系角度,来说说大数据的核心技术什么,到底要怎么学习它 ...

  9. python知识体系_python学习知识体系梳理

    工作后,先后几份工作都是跟数据处理相关的,但是没有什么技术含量,有感于手上没有一门精通的技术实在很限制个人的发展,所以想选择一门编程语言来增强自己的本领,提升自己的价值.之所以选择Python,是因为 ...

最新文章

  1. 【机器视觉案例】(9) AI视觉,手势控制电脑键盘,附python完整代码
  2. ASP中的工具类函数收集
  3. sql中的begin....end
  4. python3基础教程廖雪峰云-学习廖雪峰Python3教程的pytho
  5. OpenGL之深入解析渲染架构和数据传递
  6. 【MyEclips】“Could not create the view: An unexpected exception was thrown”错误解决
  7. 如何选择你所需的×××产品
  8. acm java 类库_ACM java入门和基本技巧
  9. 假期周进度总结(三)
  10. 新闻发布系统,我学会了什么?
  11. 美股个股熔断机制[博]
  12. mysql 存储用户头像_微信授权后用户头像保存到服务器实现方法
  13. PAT 1006 解析
  14. 什么是EDM营销?EDM营销的优点是什么?
  15. C++读写操作ofstream(数据丢失问题)
  16. 真干货!综合概述:网络营销怎么做?网络营销有哪些方式?
  17. 【调剂】北京外国语大学人工智能与人类语言重点实验室2022年全国研招统考拟接收调剂公告...
  18. 神经网络的输入稀疏矩阵,神经网络中的矩阵运算
  19. vue 实现图片查看器(仿windows图片查看器 )
  20. Focusing Attention Network(FAN)自然图像文本识别 学习笔记

热门文章

  1. php更改二维数组的键,学习猿地-php如何修改二维数组的键名
  2. python 路径规划最短距离_路径规划(最短路径)算法C#实现
  3. linux基础命令游戏,LINUX-基础命令(三)
  4. mysql的varchar 和text_MySQL中char、varchar和text的区别
  5. mysql pdo 获取最后一条sql_一条sql语句的执行过程-mysql
  6. java执行db2命令_送你一份P6级Java面试题
  7. 【BZOJ4991】我也不知道题目名字是什么(线段树)
  8. 状态空间搜索好题UVA10603
  9. zigzag矩阵按照之字形线路产生方法(C++)
  10. 敏捷开发系列之旅 第四站(透明的Crystal水晶方法) .