本笔记来源于B站Up主: 有Li 的影像组学系列教学视频
本节(30)主要介绍: SMOTE解决数据不平衡的问题

SMOTE基本介绍

SMOTE (Synthetic Minority Over-sampling Technique) 采样过程:

  1. 找到少数类中的某个样本Xi的k个近邻

  2. 随机选取一个Xi的近邻Xi(nn), 并随机生成一个介于0-1之间的数ζ1,合成的新样本Xnew = Xi + ζ1*Xi(nn)

  3. 对每一个随机选出的Xi的近邻重复步骤2

  4. 对少数类中的每个样本重复上述步骤
    例:如果样本数据是一维的,一个样本是0,它有一个近邻是1,那么合成样本将是一个0-1之间的数。

代码实现

1、导入包

# pip install -U imbalanced-learn  # for the first time
from sklearn.datasets import make_classification
import matplotlib.pyplot as plt
import seaborn as sns
import numpy as np
from collections import Counter
from imblearn.over_sampling import SMOTE

2、准备数据

X, y = make_classification(n_classes = 2, class_sep = 2,weights = [0.9, 0.1], n_informative = 2,n_redundant = 0, flip_y = 0,n_features = 2, n_clusters_per_class = 1,n_samples = 100, random_state =1)
print(Counter(y))
# > Counter({0: 90, 1: 10})


http://www.taodudu.cc/news/show-163623.html

相关文章:

  • Li‘s 影像组学视频学习笔记(28)-ROI/病灶体积的计算、Li‘s have a solution and plan.
  • 影像组学视频学习笔记(27)-SimpleITK包介绍、Li‘s have a solution and plan.
  • 影像组学视频学习笔记(25)-查看准确度、灵敏度、特异度及混淆矩阵、Li‘s have a solution and plan.
  • 影像组学视频学习笔记(21)-影像组学常用软件推荐、Li‘s have a solution and plan.
  • 影像组学视频学习笔记(19)-数据标准化、归一化极简概述、Li‘s have a solution and plan.
  • pyradiomics的yaml文件参数设置解读、Li‘s have a solution and plan.
  • 影像组学视频学习笔记(18)-使用MRIcroGL软件格式转换、勾画ROI、Li‘s have a solution and plan.
  • 影像组学视频学习笔记(22)-从atlas抠出想要的ROI做成mask文件、Li‘s have a solution and plan.
  • 回归模型(regression model)有哪些指标?如何计算回归指标(regression metrics)?如何可视化他们?
  • 异常数据(outlier data)处理基于分位数法(箱图法、箱型法)替换及删除方案
  • matplotlib画图、如何提高图像分辨率?
  • LightGBM是什么?相对于xgboost有什么优势?如何使用randomSearchCV和lightgbm进行组合获取最优参数组合?
  • xgboost是什么?相对于gbdt有什么优势?如何使用randomSearchCV和xgboost进行组合获取最优参数组合?
  • 影像组学视频学习笔记(5)-特征筛选之方差选择法、Li‘s have a solution and plan.
  • 影像组学视频学习笔记(6)-特征筛选之LASSO回归(理论)、Li‘s have a solution and plan.
  • 影像组学视频学习笔记(7)-特征筛选之LASSO回归(代码)、Li‘s have a solution and plan.
  • 影像组学视频学习笔记(9)-T检验(T-test)理论及示例、Li‘s have a solution and plan.
  • 通过构建DCA(Decision Curve Analysis)模型、获取模型数据并使用python进行绘图
  • 基于变分自动编码器(Variational Autoencoders)进行推荐系统的实施、Keras实现并可视化训练和验证误差、最后给出topK准确率和召回率
  • Li‘s 影像组学视频学习笔记(10)-T检验+lasso+随机森林、Li‘s have a solution and plan.
  • 影像组学视频学习笔记(11)-支持向量机(SVM)(理论)、Li‘s have a solution and plan.
  • 影像组学视频学习笔记(12)-支持向量机(SVM)参数优化(代码)、Li‘s have a solution and plan.
  • 影像组学视频学习笔记(14)-特征权重做图及美化、Li‘s have a solution and plan.
  • 通过交叉验证(Cross Validation)KFold绘制ROC曲线并选出最优模型进行模型评估、测试、包含分类指标、校准曲线、混淆矩阵等
  • 从pandas resample说起,然后再超越resample,通过pd.Grouper、groupby、agg
  • 使用hyperopt(Bayesian optimization)为lightGBM模型挑选最优参数进行模型构建、by Cross Validation
  • 使用hyperopt(Bayesian optimization)为xgboost模型挑选最优参数进行模型构建、by Cross Validation
  • 广义线性模型?链接函数?sigmoid和softmax?Logistic处理多分类问题?logistic回归处理超大数据?使用logistic和randomsearch进行组合获取最优参数组合、优缺点
  • 影像组学视频学习笔记(15)-ROC曲线及其绘制、Li‘s have a solution and plan.
  • 影像组学视频学习笔记(24)-文献导读:了解88种降维、分类器组合、Li‘s have a solution and plan.

影像组学视频学习笔记(30)-SMOTE解决数据不平衡的问题、Li‘s have a solution and plan.相关推荐

  1. Li‘s 影像组学视频学习笔记(10)-T检验+lasso+随机森林、Li‘s have a solution and plan.

    本笔记来源于B站Up主: 有Li 的影像组学系列教学视频 本节(10)主要介绍: T检验+lasso+随机森林 李博士借用和女朋友一起吃饭这个实例来说明:爱情和机器学习一样,复杂深奥.难以揣测. im ...

  2. Li‘s 影像组学视频学习笔记(28)-ROI/病灶体积的计算、Li‘s have a solution and plan.

    本笔记来源于B站Up主: 有Li 的影像组学的系列教学视频 本节(28)主要讲解: 用SimpleITK包进行ROI/病灶体积的计算 1.加载包 import SimpleITK as sitk im ...

  3. 影像组学视频学习笔记(12)-支持向量机(SVM)参数优化(代码)、Li‘s have a solution and plan.

    本笔记来源于B站Up主: 有Li 的影像组学系列教学视频 本节(12)主要介绍: SVM参数优化(代码) 参数优化: 自动寻找最合适的γ和C组合. 原理:遍历所有给定的参数组合,对数据进行训练,找到最 ...

  4. 影像组学视频学习笔记(31)-柱状图的python实现、Li‘s have a solution and plan.

    本笔记来源于B站Up主: 有Li 的影像组学系列教学视频 本节(31)主要介绍: 用python画柱状图,带errorbar,以及分组展示 import seaborn as sns import p ...

  5. 影像组学视频学习笔记(11)-支持向量机(SVM)(理论)、Li‘s have a solution and plan.

    本笔记来源于B站Up主: 有Li 的影像组学系列教学视频 本节(11)主要介绍: SVM支持向量机(理论) 支持向量机 (support vector machine, SVM) 号称是鲁棒性(rob ...

  6. 影像组学视频学习笔记(9)-T检验(T-test)理论及示例、Li‘s have a solution and plan.

    本笔记来源于B站Up主: 有Li 的影像组学系列教学视频 本节(9)主要介绍: T-test理论及示例 T 检验 两独立样本t检验(ttest_ind):检验两组独立样本的平均数与其分布是否具有显著性 ...

  7. 影像组学视频学习笔记(7)-特征筛选之LASSO回归(代码)、Li‘s have a solution and plan.

    本笔记来源于B站Up主: 有Li 的影像组学系列教学视频 本节(7)主要介绍: 特征筛选之LASSO回归分析(代码实现) import pandas as pd import numpy as np ...

  8. 影像组学视频学习笔记(6)-特征筛选之LASSO回归(理论)、Li‘s have a solution and plan.

    本笔记来源于B站Up主: 有Li 的影像组学系列教学视频 本节(6)主要介绍: 特征筛选之LASSO回归分析(理论通俗讲解) LASSO (Least Absolute Shrinkage Selec ...

  9. 影像组学视频学习笔记(5)-特征筛选之方差选择法、Li‘s have a solution and plan.

    本笔记来源于B站Up主: 有Li 的影像组学系列教学视频 本节(5)主要介绍: 特征筛选之方差选择法 针对医疗人员在影像组学研究中碰到的编程问题,李博士建议: 如果有一门编程语言基础的话会比较轻松 先 ...

最新文章

  1. Electron 开发环境下总是 crash
  2. (原)torch中微调某层参数
  3. 数据湖三种方案的流行度调查
  4. opencv中查看mat位图的像素幅度(Cv::matStep)
  5. 一条数据的HBase之旅,简明HBase入门教程4:集群角色
  6. 「译文」你必须掌握的 7 种 JavaScript 错误类型
  7. H2 database 操作操作内存表
  8. 省一计算机考试题库Excel,计算机等级考试省一级省计算机等级考试题库.doc
  9. WIN10安装VS2013出现兼容性问题解决
  10. mysql数据库入门传智播客答案_MySQL数据库入门
  11. 【SequoiaDB|巨杉数据库】巨杉数据库快速入门
  12. 怎么查看虚拟机上的ip地址?
  13. vue 解决跨域问题(开发环境)
  14. Python——第一天的Suger Rush
  15. baq在聊天中啥意思_baq(网络用语baq啥意思)
  16. 贝尔曼方程怎么解_强化学习系列(下):贝尔曼方程
  17. 计蒜客-天上的星星(矩阵容斥)
  18. 手机屏幕如何投屏到电脑上(Windows10)
  19. 腾讯收购Foxmail的意图
  20. unity游戏动画 从入门到住院 二 模型导入

热门文章

  1. 二叉树-二叉树的最小深度(递归法)
  2. 一杯茶的功夫,掌握Git常用命令(转载)
  3. C++中的修饰符类型
  4. opengl 创建context_OpenGL学习笔记1-创建窗口,绘制三角形
  5. 中国科学院、东南大学等联合发表最新的视觉 Transformer 综述
  6. 收藏 | 使用Mask-RCNN在实例分割应用中克服过拟合
  7. 视觉SLAM直接法与特征法及其在多传感融合中的思考
  8. 总结|ORB_SLAM2源码中字典使用细节
  9. HTML中的进度条标签的应用progress
  10. 第十六课.Pytorch-geometric入门(一)