目录

  • 前言
  • 一、函数介绍
  • 二、函数使用
  • 总结

前言

在一些情况下,数据不太均衡,这时候我们需要对数据集进行随机的抽样,而Pandas库中自带了抽样的方法


一、函数介绍

# 参数介绍
# n:要抽取的行数
# frac:当我们需要抽取数据的百分比时,我们需要用到这个参数。
# 注意:frac和n参数不可以同时使用。
# replace: 是否允许重复抽样,默认情况下为False
# weights:代表的是每个样本的权重。
# random_state: 随机种子,给定一个具体的数字,保证每次抽样的数据都是相同的。
# axis: 选择抽取数据的是行还是列,axis=0时抽取的是行,axis=1的时候抽取的是列。默认情况下axis=0,即抽取的是行。
DataFrame.sample(n=None, frac=None, replace=False, weights=None, random_state=None, axis=None)

二、函数使用

import pandas as pd
# mean:抽取样本20000行,允许重复抽样,随机种子选取为666,可以调整random_state来让自己的实验效果达到很好。
df.sample(n=20000, replace=True, random_state=666)

参考文章:


总结

中午没有睡觉,真的很困。

随机抽样方法——DataFrame.sample()相关推荐

  1. pandas对dataframe的数据列进行随机抽样(Random Sample of Columns)、使用sample函数进行数据列随机抽样

    pandas对dataframe的数据列进行随机抽样(Random Sample of Columns).使用sample函数进行数据列随机抽样 目录

  2. pandas对dataframe的数据行进行随机抽样(Random Sample of Rows):使用sample函数进行数据行随机抽样(有放回的随机抽样,replacement)

    pandas对dataframe的数据行进行随机抽样(Random Sample of Rows):使用sample函数进行数据行随机抽样(有放回的随机抽样,replacement) 目录

  3. pandas对dataframe的数据列进行随机抽样(Random Sample of Columns):使用sample函数进行数据列随机抽样(有放回的随机抽样,replacement)

    pandas对dataframe的数据列进行随机抽样(Random Sample of Columns):使用sample函数进行数据列随机抽样(有放回的随机抽样,replacement) 目录

  4. pandas的自带数据集_pandas.DataFrame.sample随机抽样

    从0到1Python数据科学之旅:http://dwz.date/cqpw 微信公众号:pythonEducation模型和统计项目QQ:231469242 1    数据切片选取 1.1    pa ...

  5. dataframe sample 采样,抽样

    20220324 https://blog.csdn.net/DSTJWJW/article/details/90667570 不重复随机抽样 20211223 # 读取数据集 test_data_a ...

  6. excel随机抽取_简单随机抽样及其进阶分层随机抽样方法展示

    一.分享简单随机抽样的几种方法 1.抽样分析工具抽样 2.INDIRECT+RANDBETWEEN函数抽样 3.RAND+排序抽样 4.SAS抽样 二.分层抽样方法 1.Python分层抽样 2.SA ...

  7. 通过ap运行cab安装程序的方法及Sample Code

    1. 第一部分:Sample Code 这部分转自:http://blog.csdn.net/hhygcy/archive/2009/05/04/4147870.aspx 最近这个东西很多被问及,软件 ...

  8. 随机抽样算子:sample和takeSample

    sample算子 说明 sample算子可以从大量的数据集中抽样,但是不能控制抽样的数目. 函数签名 代码示例 val conf: SparkConf = new SparkConf().setApp ...

  9. 手机 服务器 推送消息推送消息,推送信息到手机的pushover使用方法及sample code

    今天给大家介绍一个好东西,用了两年多了,一直没时间给大家推荐.pushover,移动端的信息推送服务API,包括使用.设置以及API实现. 用途 在关键节点放上推送(比如用户注册.举报.评论,系统检测 ...

  10. r语言实现sem_统计基础:【18】使用Excel和R语言来实现抽样

    在之前的推文中,我向大家分别介绍了简单随机抽样.系统抽样.任意抽样.整群抽样和分层抽样.详情在此不再赘述,没有相关基础的同学可以查看这部分的历史推文. 统计基础:[12]统计抽样方法总结 这5种抽样方 ...

最新文章

  1. 如何查看方法在哪里被调用
  2. Spring Boot:定制自己的starter
  3. VTK:数据结构比较用法实战
  4. iOS 9.0以后支持http协议
  5. GitHub控件之BadgeView(数字提醒)
  6. 如何讲页面打入jar包中_如何把我的Java程序变成exe文件?
  7. P2664 树上游戏(点分治/计数题计算贡献/树上差分)
  8. MongoDB官方C#驱动中查询条件Query用法
  9. 手机电子词典_网易有道入局,「智能化」能拯救电子词典这个「老古董」吗?...
  10. 如果苹果公司允许其他手机厂商使用iOS系统,对苹果公司来说会有什么好处?
  11. prim算法适用条件_内部排序算法的比较及应用
  12. vi/vim: 文件浏览和缓冲区浏览
  13. Java异常与异常处理简单使用
  14. Magic Squares
  15. 清华大学操作系统OS学习(七)——进程控制
  16. UWP 手绘视频创作工具技术分享系列 - 全新的 UWP 来画视频
  17. IAR教程之IAR下载和调试
  18. 霍兰德SC型如何选专业?霍兰德职业兴趣测试
  19. 广度优先搜索和深度优先搜索
  20. 学习笔记 Tianmao 篇 recyclerView 辅助的RecycleAdapterImpl类(适配自定义care 一型 使用了frecso SimpleDraweeView)

热门文章

  1. [机器学习入门笔记] 2. 2022吴恩达机器学习Deeplearning.ai课程(回顾)
  2. 在word文档里有一个向下的箭头,那是什么标志?
  3. 吸料机的工作原理过程
  4. 计算机主板上电源供电缩写,新电脑电源标准开始普及?取消5V、3.3V供电,主板供电变为10PIN...
  5. 微信小程序分享至朋友圈
  6. 牛顿柯特斯求积公式matlab,牛顿-柯特斯求积公式总结.ppt
  7. 用python在大麦网抢票_大麦网自动抢票工具
  8. Mac电脑彻底卸载office(Excel,Word)
  9. ps 转html node,Node.js模拟发起http请求从异步转同步的5种方法
  10. LM358恒流恒压原理