使用imblearn这个库:

from imblearn.over_sampling import SVMSMOTE, SMOTE, ADASYN, KMeansSMOTE
import pandas as pd
import numpy as np# 首先生成dataframe
df = pd.DataFrame(np.random.randint(0, 100, size=(100, 5)))
df.loc[:90, 'label'] = 1
df.loc[90:, 'label'] = 0
# 使用SMOTE算法生成数据
smote = SMOTE(random_state=0)
x_train, y_train = smote.fit_resample(df.drop(['label'], axis=1), df['label'])
# 最后的 y_train 里1与0是一样多的

python解决数据不均衡,上采样方法解决相关推荐

  1. python运行excel高级筛选怎么用_懂点EXCEL就行!教你利用Python做数据筛选(上)...

    前言 Python的数据清洗功能有多厉害,相信不用我说大家都知道了,寥寥几行代码便可以把一份杂乱无章的表格给处理的干干净净.但是python也是不容易入门的,毕竟编程语言要理解和精通也是要花不少功夫的 ...

  2. python excel筛选统计_懂点EXCEL就行!教你利用Python做数据筛选(上)

    前言 Python的数据清洗功能有多厉害,相信不用我说大家都知道了,寥寥几行代码便可以把一份杂乱无章的表格给处理的干干净净.但是python也是不容易入门的,毕竟编程语言要理解和精通也是要花不少功夫的 ...

  3. python做excel数据条件_懂点EXCEL就行!教你利用Python做数据筛选(上)

    前言 Python的数据清洗功能有多厉害,相信不用我说大家都知道了,寥寥几行代码便可以把一份杂乱无章的表格给处理的干干净净.但是python也是不容易入门的,毕竟编程语言要理解和精通也是要花不少功夫的 ...

  4. 返回Json数据浏览器带上<pre></pre>标签解决方法

    返回Json数据浏览器带上 标签解决方法 参考文章: (1)返回Json数据浏览器带上 标签解决方法 (2)https://www.cnblogs.com/Rozdy/p/4994214.html 备 ...

  5. python样本不均衡_三招提拔数据不均衡模子的机能(附python代码)

    对付深度进修而言,数据集异常主要,但在实践名目中,或多或少会遇见数据不均衡题目.甚么是数据不均衡呢?举例来说,目前有一个义务是判定西瓜是不是成熟,这是一个二分类题目--西瓜是生的照旧熟的,该义务的数据 ...

  6. 特征工程之数据预处理(上)

    机器学习入门系列(2)–如何构建一个完整的机器学习项目,第三篇! 该系列的前两篇文章: 机器学习入门系列(2)–如何构建一个完整的机器学习项目(一) 机器学习数据集的获取和测试集的构建方法 分别介绍了 ...

  7. python组合数据分类_Python解决数据样本类别分布不均衡问题

    所谓不平衡指的是:不同类别的样本数量差异非常大. 数据规模上可以分为大数据分布不均衡和小数据分布不均衡.大数据分布不均衡:例如拥有1000万条记录的数据集中,其中占比50万条的少数分类样本便于属于这种 ...

  8. python解析xml提交到hdfs_完美解决python针对hdfs上传和下载的问题

    当我们使用python的hdfs包进行上传和下载文件的时候,总会出现如下问题 requests.packages.urllib3.exceptions.NewConnectionError:: Fai ...

  9. python 处理xml pandas_Python数据处理分析,解决pandas中所有的Excel疑难杂症(上)

    发现许多小伙伴入门Python几个月,还是低效率做数据处理.这套课程以形象的示意图,精心安排的案例,循序渐进带你玩转数据处理分析神器--pandas,课程中还有分析案例噢,干货满满! 前言 经过前2个 ...

最新文章

  1. LeetCode(15):三数之和
  2. C++数组的左右旋转的实现算法(附完整源码)
  3. c++ vs 输出log到窗口_欧冠豪门碰撞,尤文vs巴萨,曼联vs红牛
  4. 给VBox中的linux添加虚拟硬盘(扩容)
  5. 关于setInterval设置倒计时只执行一次,clearInterval停止
  6. yolov3损失函数改进_YOLO V3 深度解析 (下)
  7. 如何批量修改Word文档Mathtype公式字体
  8. 【VSCode】SSH远程连接服务器
  9. 小米note2鸿蒙ROM,【ROM】小米note优化开发版MIUI9
  10. 代理服务器和IP加速器之间有什么关系?
  11. C解决duplicate symbol
  12. precision,recall,sensitivity, specificity ,mAP等几种评价指标
  13. 捣鼓openwrt不死bootloader (1)
  14. Bugku CTF 眼见为实(MISC)
  15. gpg invalid解决方法
  16. Linux Mint (应用软件— 二进制文件编辑器 :bless)
  17. 交叉编译 arm-poky-linux-gnueabi-gcc libmodbus库笔记
  18. canvas绘制分享商品海报——已完成
  19. WebService - SoapUI的使用
  20. 2021西安大小公司十套前端面试题

热门文章

  1. 启动ubuntu无反应_仅支持legacy bios 情况下 win10 安装 ubuntu 双系统踩的一坑
  2. python文件分块读取_Python多进程分块读取超大文件的方法
  3. android 广告设置秒数,Android动态显示具体到秒的相聚时间
  4. 无法回应的ARP请求包导致的网站缓慢问题排错
  5. Unity设置播放模式下始终先执行指定的场景
  6. CYQ.Data.Orm.DBFast 新增类介绍(含类的源码及新版本配置工具源码)
  7. c++ 二维数组传递
  8. Sendmail邮件服务器搭建与配置笔记
  9. scp上传服务器加特殊端口
  10. Json.Net Demo2