最近在看数据增强相关的内容,看到smote算法比较流行,具体原理和代码实现可以参考:数据分析:使用Imblearn处理不平衡数据(过采样、欠采样),正好有一份类别不平衡的数据集,正负类数据量分别为3W和50W,想要使用smote算法对正类数据进行增强看一下实际效果,具体实验结果如下:

1、原始数据结果:

2、正类数据增强1W条

3、正类数据增加一倍即3W条

4、正类数据增加5W条

5、增加至正负类比例为1:1


经过几次实验发现增强的数据量越多,正类的准确率降低、召回率提升,个人理解是数据增强的过程中引入了噪声,也就是增强的正类数据并不是真正的正类数据,在训练的过程中模型会将负类数据也认为是正类数据,从而在预测的时候将更多的数据预测为正类,最终出现准确率降低、召回率提升的现象。

数据增强算法SMOTE的实验结果分析相关推荐

  1. 目标检测常见数据增强算法汇总讲解(Mixup,Cutout,CutMix,Mosaic)

           在学习目标检测算法的过程中,发现了一些有趣的目标检测算法,打算简单写个笔记,不足之处还望谅解,可以在评论中指出来.         目标检测作为需要大量数据的算法,在实际情况中经常面临数 ...

  2. 李群 李代数在计算机视觉中的应用,李群李代数在数据融合算法中的应用分析...

    袁治晴 摘要:数据融合是提升机器人.无人驾驶.无人机等应用能力的重要手段,一直是前沿技术中研究的一个热点,关于数据融合算法的分析设计,学术界和工程界对此方面进行了长期的研究与讨论,而数据融合算法结合李 ...

  3. python数据预测模型算法_Python机器学习 预测分析核心算法

    第1章关于预测的两类核心算法 1.1为什么这两类算法如此有用 1.2什么是惩罚回归方法 1.3什么是集成方法 1.4算法的选择 1.5构建预测模型的流程 1.5.1构造一个机器学习问题 1.5.2特征 ...

  4. 为YOLOv5、YOLOv8带来全新的数据增强方式-合成雾增强算法

    简介 BestYOLO:https://github.com/WangRongsheng/BestYOLO BestYOLO是一个以科研和竞赛为导向的最好的YOLO实践框架! 目前BestYOLO是一 ...

  5. NLP数据增强方法总结:EDA、BT、MixMatch、UDA

    1. 数据增强的背景和应用场景 随着AI技术的逐步发展,更好的神经网络模型对数据规模的要求也逐步提升.而在分类任务中,若不同类别数据量相差很大,模型则会出现过拟合现象,严重影响预测的正确性. 从广义上 ...

  6. 人机交互系统(3.1)——NLP文本数据增强方法

    一.数据增强的背景和应用场景 随着AI技术的逐步发展,更好的神经网络模型对数据规模的要求也逐步提升.而在分类任务中,若不同类别数据量相差很大,模型则会出现过拟合现象,严重影响预测的正确性. 从广义上来 ...

  7. 数据增强方法——Back translations(反向翻译)

    2021SC@SDUSC 目录 2021SC@SDUSC 主要知识 代码分析 主要知识 Back translations是一种通用的数据增强算法,能在保留句子语义的情况下生成不同的句子.对于无标签数 ...

  8. 从 CV 到 NLP,深度学习领域的数据增强有哪些?

    2019-12-09 04:31:10 作者 | 张宁(哈工大SCIR) 编辑 | 唐里 本文转载自公众号 哈工大SCIR 数据增强(Data Augmentation)是一种通过让有限的数据产生更多 ...

  9. 大杀器!攻克目标检测难点秘籍四,数据增强大法

    点击上方"AI算法修炼营",选择加星标或"置顶" 标题以下,全是干货 前面的话 在前面的秘籍一:模型加速之轻量化网络.秘籍二:非极大抑制算法和回归损失优化之路. ...

最新文章

  1. Oracle语句生成+存储过程测试工具发布:Easytran V0.1
  2. 如何从Gitee中拉取项目到HBuilder中?
  3. xcode5. 安装cocos2d-x 学习中。。。
  4. 信息学奥赛一本通(1198:逆波兰表达式)
  5. Nginx使用HTTP基本身份验证限制访问
  6. VB移动没有标题的窗体
  7. 广义表head tail 运算_双链表实现LRU缓存淘汰策略
  8. vue3.0 vuex 全局变量 存储更改
  9. 三星 S7562i 一键 Root
  10. 【“新智认知”杯上海大学联赛】E-CSL的魔法(序列b到序列b‘需要的数据交换次数)
  11. 人口logistic模型公式_人口指数增长模型及Logistic模型
  12. 支付宝资金预授权(冻结、解冻、转支付、异步通知回调、撤销、授权操作查询)
  13. POJ 3674 Super Assassin 笔记 动态规划
  14. 基于keras的mnist手写体识别程序
  15. 安装和配置Apache + mongrel cluster
  16. Call Indels/SV常用软件-搬运工
  17. 计算机到金融大师,宽客人生:从物理学家到数量金融大师的传奇
  18. egg 调用html文件,egg怎么引入vue
  19. 华丽丽的旋转彩带效果
  20. 2018 | 七月日记

热门文章

  1. Laravel图片合成
  2. Android Studio 每次运行都会再下载一遍
  3. 黄金再次失守千八关口 对冲基金空头寸增加
  4. HTML页面使用Google Fonts里的字体(vscode)
  5. 室内膨胀型防火涂料根据BS 476-21 耐火标准测定需要符合几项?
  6. 华为手机怎么变鸿蒙系统,刚公布,未来你的华为手机将迎来这些改变→
  7. centos7.6安装Funwave-TVD 3.3全过程
  8. 无胁科技-TVD每日漏洞情报-2022-8-30
  9. PM 五大过程组、十大管理
  10. nginx阻挡flv视频文件上传解决方案