https://www.toutiao.com/a6706978417851499011/

机器学习并不是简单的玩数学游戏,它是能真刀真枪的解决很多实际问题的。简单归纳总结一下,机器学习主要解决六大类任务或者叫问题:分类问题、聚类问题、回归问题、关联问题、序列问题。

异常检测问题

1. 分类问题(Classification)

抽象来看,分类问题就是构造一个分类器(Classifier),可以对数据样本的类别进行预测。分类器可以理解为一个函数:y=f(x),其中x是自变量,y是因变量并且y的取值不是数值而是一个类别标签。当我们知道了x的取值之后,就可以根据f(x)来预测y的值。分类问题属于机器学习中的有监督学习。

典型的分类问题有:

判断一封邮件是否是垃圾邮件

判断一篇文章属于什么类型(例如体育类,财经类,娱乐类等)

判断贷款申请者的信用度好坏

检测信用卡消费是否存在欺诈行为

图像分类:识别图片中的物体

预测用户是否会流失

预测用户对营销活动是否会响应

预测用户对广告是否会点击

预测用户对商品是否有兴趣购买

2.聚类问题(Clustering)

“物以类聚,人以群分”,这就是聚类,它的目的就是要把相似的数据聚在一起。例如通信运营商可以对手机用户的通话行为进行聚类,把喜欢上网的聚类一类,喜欢夜间打电话的聚为另外一类。你也可以对大量的文章进行聚类,把相似的文章聚为一类然后归到同一个文件夹中。聚类问题属于机器学习中的非监督学习。

典型的聚类问题有:

用户分群:企业对用户的消费行为进行聚类,把用户划分为不同的人群,然后对用户进行差异化的营销和服务。

相似文档归类:对大量的文档进行聚类分析后,把文档分为若干个不同的类

注意:聚类和分类都有一个“类”字,但是它们有显著的差别:分类问题的“类”就是训练样本的标签,这个标签是训练模型之前需要事先标记好的,分类算法的目标是建立一个对标签进行预测的模型;而聚类的“类”,是聚类算法需要对数据进行学习之后才能得到的结果,在训练模型之前我们是不知道样本的类标签的。

3.回归问题(Regression)

回归问题和分类问题非常像,它们都属于监督学习的范畴。分类问题要构建的是分类器(Classifier),而回归问题需要构建的就是一个回归器(Regressor)。回归器也是一个函数:y=f(x),其中x是自变量,y是因变量,与分类问题不同的是,y的取值是数值而不是类别。当知道了x的值之后,就可以通过f(x)来预测y的值。

典型的回归问题有:

根据房屋的特征来预测房屋的价格

根据商品的特征来预测商品的销量

4.关联问题(Association Rule)

关联问题最有名的案例就是啤酒和尿布的故事。关联规则算法可以从交易型数据中发现频繁关联出现的Item(商品),又称为购物篮分析和关联规则挖掘。关联规则挖掘属于非监督学习。

典型的关联问题有:

买了还买:买了A商品的用户,同时还有多少比例会买其他商品

看了还看:看了A电影的用户,同时还有多少比例会看其他电影

5.序列问题(Sequence)

序列问题包括时间序列的预测,序列型关联规则(例如先看了速度与激情1,接下来看速度与激情2的可能性比较大)等。语言模型(哪些词经常可以搭配在一起)也属于序列问题。序列问题既可以是非监督学习的方法(类似关联规则算法),也可以转换为回归,分类等监督学习的问题。

典型的序列问题有:

根据用户之前购买的商品预测接下来可能会买的商品

时间序列预测:如预测股票和预测天气等

中文分词:判断哪些字组合在一起最有可能像一个词语

6.异常检测问题(Outlier Detection)

异常检测就是检测样本取值是否显著的偏离常规,从中发现有意义的孤立点和异常值。监督学习和非监督学习都可以应用于异常检测问题。

典型的异常检测问题有:

信用卡异常消费检测(欺诈检测)

网络安全检测

不合格产品检测

日常工作中,你遇到的机器学习问题基本上都逃不出这六大任务。

人工智能基础-机器学习任务之常规解决的六大问题相关推荐

  1. 人工智能基础-机器学习3-朴素贝叶斯方法

    机器学习中的线性回归算法,这一算法解决的是从连续取值的输入映射为连续取值的输出的回归问题.今天我分享的算法则用于解决分类问题,即将连续取值的输入映射为离散取值的输出,算法的名字叫作"朴素贝叶 ...

  2. 人工智能基础 | 机器学习介绍(一)

    文章目录 前言 一.机器学习中的学习方式 二.机器学习所面临的挑战 三.基本术语 四.国内公开数据集 [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-glPfYqcG-1 ...

  3. python与人工智能编程-Python是人工智能和机器学习的最佳编程语言,证据在此!...

    人工智能与机器学习是IT行业的新兴热门领域.虽然有关其发展安全性的讨论日益增多,但开发人员仍在不断扩展人工智能的能力与存储容量.如今,人工智能已远远地超出科幻小说中的构想,成为了现实.人工智能技术广泛 ...

  4. ML:人工智能之机器学习ML解决实际应用问题的思路总过程(最全)

    ML:人工智能之机器学习ML解决实际应用问题的思路总过程(最全) 目录 详细思路结构 详细思路结构

  5. 【人工智能】机器学习基础(QDU)

    转载请务必经过我的同意 [人工智能]不确定性推理(QDU) [人工智能]传统机器学习算法(QDU) [人工智能]非线性分类器(QDU) [人工智能]机器学习基础(QDU) [人工智能]深度学习(QDU ...

  6. 理解与理论:人工智能基础问题的悲观与乐观

    来源:筑土为坛 梅剑华,男,1980年生,湖北秭归人,山西大学哲学社会学院教授,博士生导师,先后赴美国罗格斯大学.匹兹堡大学.奥地利萨尔茨堡大学等访学,研究方向是语言哲学与心灵哲学.实验哲学与认知科学 ...

  7. Python人工智能基础到实战课程-北方网视频

    ** Python人工智能基础到实战课程 ** 课程主要分为6大模块,带领大家逐步进步人工智能与数据科学领域. 第一阶段:Python语言及其数据领域工具包使用 本阶段旨在帮助大家快速掌握数据领域最常 ...

  8. AI学习笔记:人工智能与机器学习概述

    一.人工智能基本概念 1.1 基本概念 数据分析:对历史规律的展现.对未来数据的预测. 机器学习:机器学习是指从一系列的原始数据中找到规律,提取人们可以识别的特征,然后通过学习这些特征,最终产生一个模 ...

  9. 人工智能和机器学习领域有哪些有趣的开源项目

    人工智能和机器学习领域有哪些有趣的开源项目? 投递人 itwriter 发布于 2014-12-02 11:21 评论(0) 有20人阅读  原文链接  [收藏]  « 本文简要介绍了 10 款   ...

最新文章

  1. Redis队列php多线程请求
  2. 计算机是如何进行时间同步的
  3. 7-11 玩转二叉树 (25 分)
  4. using filesort和using temporary
  5. python编写系统遇到的问题_python编写时遇到的小问题
  6. Python实现Kubernetes Operator
  7. SQL约束和字段约束的创建和删除
  8. 调用阿里API创建阿里云主机
  9. Atitit bootsAtitit bootstrap布局 栅格.docx 目录 1. 简述container与container-fluid的区别 1 1.1.1. 在bootstrap中的布局
  10. VSCode 离线安装中文语言包
  11. 【C语言新手】EasyX图形库使用
  12. AEJoy —— 表达式之弹性(韧性)模拟详解【JS】
  13. Visio安装失败问题解决
  14. 八数码java_八数码问题-A*算法-Java实现
  15. 词干提取算法Porter Stemming Algorithm解读
  16. Groovy语法介绍
  17. Spark CASE WHEN 写法案例
  18. SAP月结在制品结算时不产生凭证的一个问题
  19. 运算放大器(运放)介绍
  20. 《SSO系列二》自己动手写一个SSO

热门文章

  1. ValueError: Variable rnn/basic_lstm_cell/kernel already exists, disallowed.
  2. JAXB 转 XML乱码
  3. object转换成xml
  4. unzip 压缩包含路径,解压缩覆盖路径下的同名文件
  5. mysql gtid 开启失败,master--1.1.3-SNAPSHOT版本,启用GTID,启动失败
  6. 领域适配前沿研究——场景、方法与模型选择
  7. 图灵2010.01书讯——看你错过了哪一本
  8. 清华大学施路平:双脑驱动的人工通用智能
  9. 10万视频,所有面部图像均获授权,Facebook创建大规模Deepfake数据集
  10. 春节充电 | 文科生都能看懂的机器学习教程:梯度下降、线性回归、逻辑回归(附动图解释)...