随机抽样方法——DataFrame.sample()
目录
- 前言
- 一、函数介绍
- 二、函数使用
- 总结
前言
在一些情况下,数据不太均衡,这时候我们需要对数据集进行随机的抽样,而Pandas库中自带了抽样的方法
一、函数介绍
# 参数介绍
# n:要抽取的行数
# frac:当我们需要抽取数据的百分比时,我们需要用到这个参数。
# 注意:frac和n参数不可以同时使用。
# replace: 是否允许重复抽样,默认情况下为False
# weights:代表的是每个样本的权重。
# random_state: 随机种子,给定一个具体的数字,保证每次抽样的数据都是相同的。
# axis: 选择抽取数据的是行还是列,axis=0时抽取的是行,axis=1的时候抽取的是列。默认情况下axis=0,即抽取的是行。
DataFrame.sample(n=None, frac=None, replace=False, weights=None, random_state=None, axis=None)
二、函数使用
import pandas as pd
# mean:抽取样本20000行,允许重复抽样,随机种子选取为666,可以调整random_state来让自己的实验效果达到很好。
df.sample(n=20000, replace=True, random_state=666)
参考文章:
总结
中午没有睡觉,真的很困。
随机抽样方法——DataFrame.sample()相关推荐
- pandas对dataframe的数据列进行随机抽样(Random Sample of Columns)、使用sample函数进行数据列随机抽样
pandas对dataframe的数据列进行随机抽样(Random Sample of Columns).使用sample函数进行数据列随机抽样 目录
- pandas对dataframe的数据行进行随机抽样(Random Sample of Rows):使用sample函数进行数据行随机抽样(有放回的随机抽样,replacement)
pandas对dataframe的数据行进行随机抽样(Random Sample of Rows):使用sample函数进行数据行随机抽样(有放回的随机抽样,replacement) 目录
- pandas对dataframe的数据列进行随机抽样(Random Sample of Columns):使用sample函数进行数据列随机抽样(有放回的随机抽样,replacement)
pandas对dataframe的数据列进行随机抽样(Random Sample of Columns):使用sample函数进行数据列随机抽样(有放回的随机抽样,replacement) 目录
- pandas的自带数据集_pandas.DataFrame.sample随机抽样
从0到1Python数据科学之旅:http://dwz.date/cqpw 微信公众号:pythonEducation模型和统计项目QQ:231469242 1 数据切片选取 1.1 pa ...
- dataframe sample 采样,抽样
20220324 https://blog.csdn.net/DSTJWJW/article/details/90667570 不重复随机抽样 20211223 # 读取数据集 test_data_a ...
- excel随机抽取_简单随机抽样及其进阶分层随机抽样方法展示
一.分享简单随机抽样的几种方法 1.抽样分析工具抽样 2.INDIRECT+RANDBETWEEN函数抽样 3.RAND+排序抽样 4.SAS抽样 二.分层抽样方法 1.Python分层抽样 2.SA ...
- 通过ap运行cab安装程序的方法及Sample Code
1. 第一部分:Sample Code 这部分转自:http://blog.csdn.net/hhygcy/archive/2009/05/04/4147870.aspx 最近这个东西很多被问及,软件 ...
- 随机抽样算子:sample和takeSample
sample算子 说明 sample算子可以从大量的数据集中抽样,但是不能控制抽样的数目. 函数签名 代码示例 val conf: SparkConf = new SparkConf().setApp ...
- 手机 服务器 推送消息推送消息,推送信息到手机的pushover使用方法及sample code
今天给大家介绍一个好东西,用了两年多了,一直没时间给大家推荐.pushover,移动端的信息推送服务API,包括使用.设置以及API实现. 用途 在关键节点放上推送(比如用户注册.举报.评论,系统检测 ...
- r语言实现sem_统计基础:【18】使用Excel和R语言来实现抽样
在之前的推文中,我向大家分别介绍了简单随机抽样.系统抽样.任意抽样.整群抽样和分层抽样.详情在此不再赘述,没有相关基础的同学可以查看这部分的历史推文. 统计基础:[12]统计抽样方法总结 这5种抽样方 ...
最新文章
- 如何查看方法在哪里被调用
- Spring Boot:定制自己的starter
- VTK:数据结构比较用法实战
- iOS 9.0以后支持http协议
- GitHub控件之BadgeView(数字提醒)
- 如何讲页面打入jar包中_如何把我的Java程序变成exe文件?
- P2664 树上游戏(点分治/计数题计算贡献/树上差分)
- MongoDB官方C#驱动中查询条件Query用法
- 手机电子词典_网易有道入局,「智能化」能拯救电子词典这个「老古董」吗?...
- 如果苹果公司允许其他手机厂商使用iOS系统,对苹果公司来说会有什么好处?
- prim算法适用条件_内部排序算法的比较及应用
- vi/vim: 文件浏览和缓冲区浏览
- Java异常与异常处理简单使用
- Magic Squares
- 清华大学操作系统OS学习(七)——进程控制
- UWP 手绘视频创作工具技术分享系列 - 全新的 UWP 来画视频
- IAR教程之IAR下载和调试
- 霍兰德SC型如何选专业?霍兰德职业兴趣测试
- 广度优先搜索和深度优先搜索
- 学习笔记 Tianmao 篇 recyclerView 辅助的RecycleAdapterImpl类(适配自定义care 一型 使用了frecso SimpleDraweeView)
热门文章
- [机器学习入门笔记] 2. 2022吴恩达机器学习Deeplearning.ai课程(回顾)
- 在word文档里有一个向下的箭头,那是什么标志?
- 吸料机的工作原理过程
- 计算机主板上电源供电缩写,新电脑电源标准开始普及?取消5V、3.3V供电,主板供电变为10PIN...
- 微信小程序分享至朋友圈
- 牛顿柯特斯求积公式matlab,牛顿-柯特斯求积公式总结.ppt
- 用python在大麦网抢票_大麦网自动抢票工具
- Mac电脑彻底卸载office(Excel,Word)
- ps 转html node,Node.js模拟发起http请求从异步转同步的5种方法
- LM358恒流恒压原理