使用如下数据:

import pandas as pd
import numpy as npdf = pd.DataFrame(data=np.random.randint(0, 20, size=(1000, 10)))

设置随机种子:

np.random.seed(10)

方法1:

sample_df = df.sample(50)

方法2:

sample_df2 = df.loc[np.random.choice(df.index, 50)]

pandas dataframe随机采样相关推荐

  1. ML之FE:数据随机抽样之利用pandas的sample函数对超大样本的数据集进行随机采样,并另存为csv文件

    ML之FE:数据随机抽样之利用pandas的sample函数对超大样本的数据集进行随机采样,并另存为csv文件 目录 数据随机抽样之利用pandas的sample函数对超大样本的数据集进行随机采样,并 ...

  2. pandas创建内容全是0的dataframe、pandas基于随机整数、随机浮点数创建dataframe(random numbers)

    pandas创建内容全是0的dataframe.pandas基于随机整数.随机浮点数创建dataframe(random numbers) 目录 pandas创建内容全是0的dataframe.pan ...

  3. dataframe sample 采样,抽样

    20220324 https://blog.csdn.net/DSTJWJW/article/details/90667570 不重复随机抽样 20211223 # 读取数据集 test_data_a ...

  4. 最小二乘法以及RANSAC(随机采样一致性)思想及实现

    线性回归–最小二乘法(Least Square Method) 线性回归: 什么是线性回归? 举个例子,某商品的利润在售价为2元.5元.10元时分别为4元.10元.20元, 我们很容易得出商品的利润与 ...

  5. 『Python核心技术与实战』pandas.DataFrame()函数介绍

    pandas.DataFrame()函数介绍! 文章目录 一. 创建DataFrame 1.1. numpy创建 1.2. 直接创建 1.3. 字典创建 1.4. Series和DataFrame 二 ...

  6. 【Stacking改进】基于随机采样与精度加权的Stacking算法

    [Stacking改进]基于随机采样与精度加权的Stacking算法 摘要 近年来,人工智能的强势崛起让我们领略到人工智能技术的巨大潜力,机器学习也被广泛应用于各个领域,并取得不错的成果.本文以Kag ...

  7. 前锋python百度云_关于python:使用索引在pandas DataFrame中设置特定单元格的值

    我创建了一个熊猫数据框架 df = DataFrame(index=['A','B','C'], columns=['x','y']) 得到了这个 x    y A  NaN  NaN B  NaN ...

  8. Python-pcl 随机采样一致性算法

    RANSAC 随机采样一致性算法 RANSAC是一种随机参数估计算法.RANSAC从样本中随机抽选出一个样本子集,使用最小方差估计算法对这个子集计算模型参数,然后计算所有样本与该模型的偏差,在使用一个 ...

  9. pandas使用tabulate函数将pandas dataframe以类似于plsql表格的方式打印出来(printing dataframe in tabular format)

    pandas使用tabulate函数将pandas dataframe以类似于plsql表格的方式打印出来(printing dataframe in tabular format) 目录

最新文章

  1. 磁铁驱动反向续流串接电阻的的分析
  2. go 读取 json 配置文件
  3. 测试规范包括哪些_光学会自动化测试还不够?还差最后这一步!
  4. 怎么用python处理excel文件-如何用python处理excel表格
  5. asmack xmpp 获取离线消息
  6. 使用docker-compose配置redis服务
  7. CUDA ERROR: device-side assert triggered at解决
  8. python索引用法_python 列表索引问题
  9. linux+echo+权限不够,解决linux echo命令以及linux echo命令提示权限不够的方法
  10. 机器学习基础算法29-EM实践
  11. MED-V服务器配置,MED-V系列之二
  12. Android权限大全
  13. 从链家爬取北京各区二手房房价进行分析并实现数据可视化
  14. 西门子SCL编程语言入门基础知识
  15. 关于日本人的笑话合集(转载)
  16. turtle库画图单击鼠标获取坐标位置
  17. Python基础知识:数据类型--数值型
  18. 基于weixin-java-tools集成微信小程序支付功能
  19. 【附源码】Python计算机毕业设计特大城市地铁站卫生防疫系统
  20. f2fs学习笔记 - 7. f2fs文件打开

热门文章

  1. matlab磁铁模拟,用matlab-模拟环形磁铁的磁场分布
  2. python远程主机强迫关闭了_Python 远程主机强迫关闭了一个现有的连接
  3. 思科怎么修改dhcp服务器地址,思科交换机配置作为DHCP服务器的配置方法是怎样的?...
  4. mysql 快速初始化_MySQL中的批量初始化数据的对比测试(r12笔记第71天)
  5. 用StreamReader读取服务器端文本文件,或远程网页
  6. Glory Ex坚持发展核心竞争力,致力于让更多人走进数字资产
  7. oracle视图总结(创建、查询、改动、删除等)
  8. 老男孩的学生优秀博文及内部教学文章
  9. ubuntu安装postgreSQL 9.3
  10. 干净虚拟机(centos 6.4)上从头到尾安装并调试Mdrill(四)