今天推荐的是一个 github 项目,项目地址如下,主要是类别不平衡学习的论文、代码、框架、库等资源

https://github.com/ZhiningLiu1998/awesome-imbalanced-learning

本文首发于我的知乎专栏:https://zhuanlan.zhihu.com/p/142692473,阅读会更加方便,可以直接点击链接,可以点击文章底部”阅读原文“直接跳转。

前言

类别不平衡(Class-imbalance),也被称为长尾问题(long-tail problem),指的是分类问题中数据集的类别数量并不一致,有的类别特别多,但有的类别特别少,并且这是实际应用里非常常见的问题。例如,欺诈检测,罕见药物不良反应的预测,以及基因家族预测。因为类别不平衡的原因就会导致预测不准确,降低了分类模型的性能。因此,不平衡学习(Imbalanced learning)的目标就是要解决类别不平衡问题,并从不平衡的数据中学习一个无偏模型。

目录如下所示:

代码库/框架

Python

R

Java

Scalar

Julia

论文

综述

深度学习

数据重采样(Data resampling)

成本敏感学习(Cost-sensitive Learning)

集成学习(Ensemble Learning)

异常检测

其他

不平衡数据库

其他的资源

另外,带有

深度学习分类类别不平衡_Github|类别不平衡学习资源(上)相关推荐

  1. 多类别不平衡分类-解决方案:概述【集成学习、数据重采样、深度学习(元学习)、异常检测】

     类别不平衡(又称长尾问题)是指在分类问题中,类别之间的表示质量/样本数量不平等. 类别不平衡在实践中广泛存在,例如金融欺诈检测.入侵检测.医疗辅助诊断等罕见模式识别任务. 类的不平衡往往会导致传统机 ...

  2. 分类中常见的类别不平衡问题解决方法

    常见的类别不平衡问题解决方法 常见的类别不平衡问题解决方法 那么,什么是"类别不平衡"? 解决方法 1.扩大数据集 2.欠采样 3.过采样 4.使用新评价指标 5.尝试不同的分类算 ...

  3. 使用Sci-kit学习和XGBoost进行多类别分类:使用Brainwave数据的案例研究

    by Avishek Nag (Machine Learning expert) 作者:Avishek Nag(机器学习专家) 使用Sci-kit学习和XGBoost进行多类别分类:使用Brainwa ...

  4. 深度学习分类任务常用评估指标

    摘要:这篇文章主要向大家介绍深度学习分类任务评价指标,主要内容包括基础应用.实用技巧.原理机制等方面,希望对大家有所帮助. 本文分享自华为云社区<深度学习分类任务常用评估指标>,原文作者: ...

  5. 数据安全分类分级实施指南_不平衡数据集分类指南

    数据安全分类分级实施指南 重点 (Top highlight) Balance within the imbalance to balance what's imbalanced - Amadou J ...

  6. 深度 | 解决真实世界问题:如何在不平衡类上使用机器学习?

    原文:http://mp.weixin.qq.com/s?__biz=MzA3MzI4MjgzMw==&mid=2650718717&idx=1&sn=85038d7c906c ...

  7. 在机器学习分类中如何处理训练集中不平衡问题

    版权声明:未经许可, 不能转载 目录(?)[-] 在分类中如何处理训练集中不平衡问题 Jason Brownlee的回答 什么是类别不均衡问题 类别不均衡问题是现实中很常见的问题 八大解决方法 选择某 ...

  8. 在分类中如何处理训练集中不平衡问题

    原文地址:一只鸟的天空,http://blog.csdn.net/heyongluoyao8/article/details/49408131 在分类中如何处理训练集中不平衡问题   在很多机器学习任 ...

  9. 【分类】在分类中如何处理训练集中不平衡问题

    原文链接:http://blog.csdn.net/heyongluoyao8/article/details/49408131 在分类中如何处理训练集中不平衡问题   在很多机器学习任务中,训练集中 ...

最新文章

  1. 网久环境服务启动命令
  2. JavaScript多态
  3. vue-router(2)
  4. performSelector may cause a leak because its selector is unknown
  5. Qt Creator 代码自动补全设置
  6. 印象笔记三级目录_我的印象笔记使用手册
  7. Android 第一课 Activity
  8. “智囊”机器人:让我为你解答工作中的任何问题!
  9. C# ref,out
  10. 拓端tecdat|R语言使用Metropolis-Hastings采样算法自适应贝叶斯估计与可视化
  11. Atitit.提升软件稳定性---基于数据库实现的持久化 循环队列 环形队列
  12. reduce python3_Python3的高阶函数:map,reduce,filter
  13. 第三方支付,微信支付及支付宝的一些入门了解
  14. 三菱PLC 定时器
  15. python-指数分布介绍(scipy.stats.expon)
  16. 无盘服务器固态硬盘做什么盘,哪个固态硬盘无盘服务器上最好?固态硬盘无盘服务器上详细介绍。...
  17. 猎聘和BOSS直聘谁会成为在线招聘的最后赢家?
  18. 曹雪芹诗歌中的鸿蒙,曹雪芹诗词选
  19. Hibernate5的学习笔记(二)
  20. fusionCharts属性集

热门文章

  1. Oracle EBS使用CSV导入Oracle Form及BOM清单导入 API
  2. 华为服务器上安装vm系统,云服务器安装vm教程
  3. 复现有道NLPCC-2018 CGEC:A Neural Machine Translation Approach to Chinese Grammatical Error Correction
  4. Python科学计算-Numpy和Pandas学习笔记(一)-安装、Numpy属性和常用方法(chaochao`s Blog)
  5. 递归实现数组的扁平化
  6. 知识图谱嵌入|KG-BERT代码 ConvE ConvR
  7. 电脑现在找不到驱动器,设备管理器显示DVD/CD-ROM驱动器是黄色感叹号
  8. cnpm使用报错-最佳方案
  9. 互联网的控制权——根服务器
  10. Chrome浏览器录屏扩展插件