最近在接触机器学习这一块的内容,不知道能学到哪个程度。先简单地介绍它到底是什么?

python学习入门介绍

  • 1 机器学习基本介绍
  • 2 机器学习分类
  • 3 机器学习模型评估

1 机器学习基本介绍

(1)定义:机器学习是从数据中自动分析获取模型,并利用模型对未知数据进行预测。

(2)工作流程
通常可以分为下面这几个步骤:
搜集数据–数据进行基本处理–利用训练集提取特征(特征工程)–利用训练集机器学习–使用预测数据集模型评估

1)获取数据:
数据来源:爬虫、数据库等等
数据类型:有目标值+连续(如房价、身高等)、有目标值+离散(如次数、频率等)、无明确目标值(分类)
2)数据处理:满足完整性(是否存在缺失值)、全面性、合法性(合理性)、唯一性
3)数据集分割:一般将数据划分为训练集和测试集(比例有:75%:25%、80%:20%、70%:30%等)
4)特征工程:基于学习项目的特点提取特征,使得特征能够在机器学习中发挥更强作用,通过需要一定的专业背景知识和技巧处理数据。一般包括如下步骤:
a)特征提取:将文本信息转为计算机可读懂的数字
b)特征预处理:通过⼀些转换函数将特征数据转换成更加适合算法模型的特征数据过程
c)特征降维:指在某些限定条件下,降低随机变量(特征)个数,得到⼀组“不相关”主变量的过程

举个例子,区分红细胞和白细胞

2 机器学习分类

(1)监督学习(Supervised learning)
监督学习简单理解就是有目标值,主要分为回归问题与分类问题。
回归问题通常是找到合适的拟合函数

分类问题:通常是找到合适的分类函数,常用算法有K-近邻算法、贝叶斯分类、决策树与随机森林、逻辑回归、神经网络

(2)无监督学习(Unsupervised learning)
无监督学习意味着输入数据没有被标记,也没有确定的结果(无具体目标值)。样本数据类别未知,需要根据样本间的相似性对样本集进行分类(聚类)试图使类内差距最小化,类间差距最大化。
聚类算法:K-means、PCA降维

(3)半监督学习(Semi-Supervised learning)
半监督学习就可以简单理解为⼀部分数据有目标,而⼀部分数据无目标。主要使用于监督学习效果不能满足需求时,就使用半监督学习来增强学习效果。

(4)强化学习(Reinforcement learning)
增强学习主要⽤来自动进行决策,并且可以做连续决策。也就是说,整个过程都是⼀个动态的,上⼀步数据的输出是下⼀步数据的输入

3 机器学习模型评估

模型评估是模型开发过程不可或缺的⼀部分。它有助于发现表达数据的最佳模型和所选模型将来⼯作的性能如何。按照数据集的目标值不同,可以把模型评估分为分类模型评估和回归模型评估。

  • 分类模型评估
    注重准确率、精确率、召回率、F1-score、AUC指标

  • 回归模型评估
    包括均方根误差(Root Mean Squared Error,RMSE)、相对平方误差(relative squared error,RSE)、平均绝对误差(Mean Absolute Error,MAE)、相对绝对误差(relative absolute error,RAE)。

(1) 均方根误差(Root Mean Squared Error,RMSE):⼀个衡量回归模型误差率的常⽤公式。但是,它仅能比较误差是相同单位的模型。(p是预测值,a是真实值)

(2)相对平方误差(relative squared error,RSE):可以比较不同单位的模型

(3)平均绝对误差(Mean Absolute Error,MAE):与原始数据单位相同,它仅能比较误差是相同单位的模型。量级近似与RMSE,但是误差值相对小⼀些。

(4)相对绝对误差(relative absolute error,RAE):可以比较误差是不同单位的模型

模型评估呈现的是拟合的结果,最优的拟合是恰好拟合。然而可能会出现过拟合和欠拟合两种情况。

过拟合:由于特征过于细化等原因,导致模型单纯局限(适合)于训练集

相反,欠拟合就是特征过少,导致模型评估不准确。

python机器学习 | 入门介绍相关推荐

  1. python教学视频下载-Python机器学习入门教程全套视频下载【传智播客】

    Python机器学习入门教程 初级共3天课 本套教程是机器学习的入门课程,主要介绍一些经典的传统机器学习算法,如分类算法:KNN算法,朴素贝叶斯算法,逻辑回归,决策树算法以及随机森林;回归算法:线性回 ...

  2. python人工智能入门书籍推荐-小编就给大家推荐几本python机器学习入门书!

    很多人对于机器学习很感兴趣,所以想要通过一些书籍来学习研究,那么有哪些机器学习入门书籍推荐呢?本文小编就给大家推荐几本python机器学习入门书,大家可以去书店具体购买. 有哪些机器学习入门书籍推荐呢 ...

  3. 入行AI,你需要一本Python机器学习入门

    ​ 目前机器学习红遍全球.男女老少都在学机器学习模型,分类器,神经网络和吴恩达.你也想成为一份子,但你该如何开始? 今天小编推荐这本<Python机器学习>教你快速入门. ​ 01什么是机 ...

  4. python机器学习入门(Day1:Numpy)

    在对python机器学习快速入门之前,需要具备一定的先导知识.本次,我们对python常见库numpy进行介绍 NumPy是一个开源的Python科学计算基础库,同时也是SciPy. Pandas等数 ...

  5. 入行AI,你需要一本Python机器学习入门 1

    点击此处添加图片说明文字 ​ 目前机器学习红遍全球.男女老少都在学机器学习模型,分类器,神经网络和吴恩达.你也想成为一份子,但你该如何开始? 今天小编推荐这本<Python机器学习>教你快 ...

  6. Python机器学习入门资料整理

    在python基本语法入门之后,就要准备选一个研究方向了.Web是自己比较感兴趣的方向,可是,导师这边的数据处理肯定不能由我做主了.paper.peper.paper--真的挺愁人的 还有几个月就要进 ...

  7. 入行AI,你需要一本Python机器学习入门,赶紧收藏!

    目前 机器学习 红遍全球.男女老少都在学机器学习模型,分类器,神经网络和吴恩达.你也想成为一份子,但你该如何开始? 1.什么是机器学习? 从出生的那天起,我们就一直在学习中度过.随着逐渐的成长,开始学 ...

  8. Python机器学习框架介绍

    目录 1 为什么选择用Python 2 机器学习和深度学习框架 2.1 Pandas 2.2 Num Py 2.3 Matplotlib 2.4 Seaborn 2.5 Scikit-learn 2. ...

  9. Python机器学习入门1.1《良、恶性乳腺肿瘤预测》

    本教程实用于0基础从事机器学习的人,OK,我们主要是用Python实现机器学习的,所以,你应该花三天时间去看看Python,然后我会有清晰的步骤与每个步骤错误提示,如果你还有什么问题,可以回复我. 这 ...

  10. 常用Python机器学习库介绍

    Python是一种面向对象的解释型计算机程序设计语言,具有丰富和强大的库,再加上其简单.易学.速度快.开源免费.可移植性.可扩展性以及面向对象的特点,Python成为2017年最受欢迎的最受欢迎的编程 ...

最新文章

  1. 浅谈 Kubernetes 中的服务发现
  2. sql当等INSERT之后获取主键值
  3. linux通过命令行本地目录取消svn关联
  4. One order search dynamic sql statement生成位置
  5. Facebook传遍全球的17张励志海报
  6. Python 爬取了马蜂窝的出行数据,告诉你这个夏天哪里最值得去!
  7. vue.js 使用axios实现下载功能
  8. 问题记录——com.mysql.jdbc.exceptions.jdbc4.CommunicationsException: Communications link failure...
  9. 35岁是青春的后期你最好把下面十件事做好
  10. 删除双系统遗留的efi
  11. 活动预告|CodeWisdom软件供应链系列学术报告:第4期(何昊 北京大学)
  12. 【react】---redux-actions的基本使用---【巷子】
  13. 有道单词导入 大量有道单词 生词本 批量导入 添加 有道单词XML 背单词
  14. 仪表板 ajax实例,CQD 开发示例 - Skype for Business Server 2015 | Microsoft Docs
  15. axure 母版自定义触发事件的工作机制
  16. 轻量化网络—ShuffleNet V1 V2理解
  17. 天视通支持海康威视摄像头吗_海康威视突然做电脑,到底有胜算吗?
  18. php die 跳转,php里or die的常见用法
  19. Supervisor启动java服务(jar)
  20. java swing开发窗体程序开发(四)MVC结构

热门文章

  1. Hadoop2.6.0配置參数查看小工具
  2. python基础-大杂烩
  3. libsqlite3.dylib找不到
  4. 关于元素水平垂直居中的那些事?
  5. 【Linux学习笔记】Linux-CentOS下安装Redis
  6. 防范项目中人员频繁变动的风险
  7. gcc CFLAGS中调试和优化标志
  8. python treeview显示多列_Python tkinter treeview列大小
  9. 使用listen()和accept()函数
  10. a href='../目录 +变量+ ' download='../目录 +变量+“'查看附件/a 使用变量