前言

最近在读论文的的过程中接触到多标签分类(multi-label classification)的任务,必须要强调的是多标签(multi-label)分类任务 和 多分类(multi-class)任务的区别:

  • 多标签分类任务指的是一条数据可能有一个或者多个标签,举个例子:比如一个病人的体检报告,它可能被标记上,高血压,高血糖等多个标签。
  • 多分类任务指的是一条数据只有一个标签,但是标签有多种类别。机器学习中比较经典的iris鸢尾花数据集就是标准的多分类任务,一条数据喂给模型,模型需判断它是3个类别中的哪一个。

这里博主强调一下多标签分类任务的两个特点:

  • 类别标的数量是不确定的,有些样本可能只有一个类标,有些样本可能存在多个类别标签。
  • 类别标签之间可能存在相互依赖关系,还是拿我上述的例子来说:如果一个人患有高血压,他有心血管疾病的概率也会变大,所以高血压这个label和心血管疾病的那些labels是存在一些依赖关系的。

多标签分类算法简介

多标签分类算法比较常用的有ML-KNN、ML-DT、Rank-SVM、CML等。我就不多介绍这些基于传统机器学习的方法,感兴趣的同学可以自己去研究。这里主要介绍如何采用深度学习模型做多标签分类任务,首先我们必须明确一下多标签分类模型的输入和输出。

模型输入输出

假设我们有一个体检疾病判断任务:通过一份体检报告判断一个人是否患有以下五种病:有序排列——[高血压ÿ

深度学习核心技术精讲100篇(七)-keras 实战系列之深度学习模型处理多标签(multi_label)相关推荐

  1. 深度学习核心技术精讲100篇(二十)-如何通过树模型实现梯度提升树(GBDT)+LR,随机森林(RandomForest) +LR

    前言 在讲如何通过树模型做特征工程之前,首先让我们回顾一下一个机器学习(除去深度学习项目部分)项目的大致流程: 从业务场景中抽象出问题--分类问题,回归问题,还是聚类问题等, 接下来是数据获取,数据清 ...

  2. 深度学习核心技术精讲100篇(四十四)-深度召回在招聘推荐中的挑战和实践

    前言 招聘业务是多行为场景,用户需求和交互周期短.行为稀疏.本次分享基于业务挑战,将介绍代价敏感.向量检索等技术在招聘深度召回中的应用,最后总结实践中的教训与心得. 主要内容包括: 58招聘业务场景 ...

  3. 深度学习核心技术精讲100篇(二十二)-深度解析数学建模核心知识之搜索与推荐模型中用户建模原理

    前言 用户建模是搜索与推荐模型的核心技术.其实很多人对用户模型的概念比较模糊,用户模型更多是在产品生命周期中起关键作用,其结合数据.反馈.行为三个方面的信息总结概括出产品用户模型. 01 背景与意义 ...

  4. 深度学习核心技术精讲100篇(五十五)-深度解读分布式定时任务框架

    前言 我们先思考下面几个业务场景的解决方案: 支付系统每天凌晨1点跑批,进行一天清算,每月1号进行上个月清算 电商整点抢购,商品价格8点整开始优惠 12306购票系统,超过30分钟没有成功支付订单的, ...

  5. 深度学习核心技术精讲100篇(四十九)-深度学习之关联规则

    前言 关联规则分析就是在交易数据.关系数据或其他信息载体中,查找存在于项目集合或对象集合之间的频繁模式.关联.相关性或因果结构. "啤酒与尿布"的例子相信很多人都听说过吧,故事是这 ...

  6. 深度学习核心技术精讲100篇(七十九)-深度学习应用实战案例:携程金融自动化迭代反欺诈模型体系

    前言 支付欺诈风险是携程金融风控团队的主要防控对象,它一般是指用户卡片信息或账号信息泄露后,欺诈分子利用这些信息在携程平台进行销赃,侵害用户资金安全,给用户和携程平台带来损失. 1. 高对抗性 欺诈分 ...

  7. 深度学习核心技术精讲100篇(六)-keras 实战系列之知识蒸馏(Knowledge Distilling)

    前言 深度学习在这两年的发展可谓是突飞猛进,为了提升模型性能,模型的参数量变得越来越多,模型自身也变得越来越大.在图像领域中基于Resnet的卷积神经网络模型,不断延伸着网络深度.而在自然语言处理领域 ...

  8. 深度学习核心技术精讲100篇(四十三)-人工智能新技术-知识普及篇:一文带你深入认识下联邦学习的前世今生

    前言 联邦学习(Federated Learning)作为人工智能的一个新分支,为机器学习的新时代打开了大门. 本文为您解读: 1. 联邦学习为什么这么热? 2. 联邦学习能做什么? 3. 三合一速成 ...

  9. 深度学习核心技术精讲100篇(七十五)-集成学习

    前言 在解决分类问题时,假如分类模型不够强大,对样本的分类结果就不会很理想.这时如果我们多找一些分类模型,让它们一起做决策,模型强度会不会高一点呢? 集成学习就是把多种分类器按策略组合起来,并根据所有 ...

最新文章

  1. 背包思想计算方案的总数(货币系统)
  2. 面试官:谈谈equals() 和 == 的区别
  3. 剑指offer之二叉树的下一个结点
  4. [Linux]共享内存
  5. app每秒并发数_性能测试连载 (38) jmeter 线程数与性能测试的负载模式
  6. 没有Dubbo Admin,怎么查看zookeeper中注册的dubbo服务?
  7. 关于LUA+Unity开发_XLua篇
  8. csgo天津服务器维护怎么办,CSGO华北赛区在天津落下帷幕
  9. redis--服务器与客户端
  10. matlab卷积神经网络代码_卷积神经网络(四):反向传播过程的代码实现
  11. 合作博弈:夏普利值(shapley value)性质与算法
  12. word2016自带公式编辑器转换成mathtype类型公式,以及设置公式大小
  13. word新建文档默认文件名_如何更改保存Word文档时使用的默认文件名
  14. 职场生涯的3个步骤--法、儒、道家的管理哲学
  15. Python chain
  16. 【弄nèng - Activiti6】Activiti6入门篇(十七)—— 消息中间事件
  17. python输出26个大小写字母_python实现生成字符串大小写字母和数字的各种组合
  18. 49、建筑外墙上防火墙的设置
  19. 【模型分享】SolidWorks摇摆轮机构运动仿真
  20. APS系统如何让企业实现“多赢”?看高博通信是怎么做的

热门文章

  1. SlidingMenu(一)
  2. Spring3MVC+Mybatis3.1框架下的事务
  3. C#集合类(HashTable, Dictionary, ArrayList,List)与HashTable线程安全
  4. 腾讯:互联网正进入社区化阶段
  5. 剑指offer:滑动窗口最大值
  6. CSP认证201503-1 图像旋转[C++题解]:模拟
  7. Linux 环境编程 用户层定时器使用二 timer_create的使用
  8. linux 校验文件生成,在Linux中了解如何使用MD5校验和生成和验证文件
  9. 计算机网络按定义分,计算机网络定义及其分类
  10. Qt中的QStackedLayout