随机打乱数据框DataFrame中行的顺序
数据框(DataFrame)是pandas中一种重要的数据结构,你可以将其想象为一个关系型数据表格,其中包含多个行和已命名的列。可以通过字典的方式创建DataFrame,示例代码如下:
import pandas as pdcity_names = pd.Series(['San Francisco', 'San Jose', 'Sacramento'])
population = pd.Series([852469, 1015785, 485199])cities = pd.DataFrame({ 'City name': city_names, 'Population': population })
我们打印cities,可以看到DataFrame的内容如下:
print(citys)
City name Population
0 San Francisco 852469
1 San Jose 1015785
2 Sacramento 485199
下面进入本次介绍的主要内容。DataFrame有一个属性被称为index,该属性会向DataFrame的每一行赋一个标识符值。默认情况下,在构造DataFrame时,pandas会赋给每一行0,1,2,3··· 这样的索引值。而且索引值在创建后是稳定的,也就是说,它们不会因为数据重新排序而发生改变。
通过上面一番解释,我们就会明白索引值与相应行的内容在一开始就绑定好了,所以我们要想随机对行进行排序,只需要打乱索引值的顺序即可。我们可以这样做:
cities.reindex([2, 0, 1])
通过DataFrame的reindex方法实现改变行的排序。但是通过这种方法只能实现特定方式的排序,并不能任意打乱,要实现随机任意排序,还需要借助numpy中的 random.permutation
函数。
import numpy as npcities.reindex(np.random.permutation(cities.index))
最后还需要注意一点,通过上面的命令只是输出了乱序之后的中间数据框,并非cities本身,要实现彻底改变cities本身的行排序,不要忘记还需要将乱序后的中间DataFrame赋值给cities,如下:
cities = cities.reindex(np.random.permutation(cities.index))
随机打乱数据框DataFrame中行的顺序相关推荐
- dataframe数组做元素_数组 array 矩阵 list 数据框 dataframe
#R语言备忘录三# #数组array和矩阵matrix.列表list.数据框dataframe #数组 #数组的重要属性就是dim,维数 #得到4*5的矩阵 z dim(z) z #构建数组 x #三 ...
- excel取整数的函数_函数010 EXCEL如何随机打乱数据,不重复随机数来帮忙!
今天我们继续学习我们函数实战系列!一个不小心,我们已经更新9期了,今天就是第十期!具体讲点啥? 第十期-生成随机不重复数据! 顺势我们把相关的随机函数也学习一下,一举两得! 在EXCEL的中,要生成随 ...
- Python数据框DataFrame的数据筛选
[小白从小学Python.C.Java] [Python全国计算机等级考试] [Python数据分析考试必会题] ● 标题与摘要 Python数据框DataFrame的 数据筛选 ● 选择题 关于数据 ...
- 【python-numpy 】中的随机打乱数据方法np.random.shuffle
描述: shuffle() 方法将序列的所有元素随机排序. #实验可得每次shuffle后数据都被打乱,这个方法可以在机器学习训练 #的时候在每个epoch结束后将数据重新洗牌进入下一个epoch的学 ...
- R 语言之数据框dataframe和tibble
文章目录 学习目标 学习内容 dataframe的具体使用 dataframe和 tibble的区别 小结 学习目标 我们所采用的学习内容来自B站的Lizongzhang老师的R语言的学习分享 今天学 ...
- 随机打乱数据的几种方式
基于pytorch indices = torch.randperm(len(dataset)).tolist() dataset = torch.utils.data.Subset(dataset, ...
- dataframe转化为array_Pandas入门教程:如何将列表转化成数据框?
Pandas模块提供了处理数据.数据分析的各种功能.Pandas主要有两种数据结构:Series和DataFrame.本文将介绍一下将一个或者多个列表(list)转化成数据框(DataFrame)的方 ...
- python数据框常用操作_转载:python数据框的操作
我们接着上次分享给大家的两篇文章:Python数据分析之numpy学习(一)和Python数据分析之numpy学习(二),继续讨论使用Python中的pandas模块进行数据分.在接下来的两期pand ...
- python 数据框按行拼接_使用python进行数据分析
Python常用的两类数据分析包:numpy.pandas 一.一维数据分析 (1)numpy数据包的导入.一维数据组的赋值与查询 (2)numpy一维数据与列表的区别 1.可以用来实现统计功能 如计 ...
最新文章
- Hadoop的学习前奏(一)——在Linux上安装与配置Hadoop
- easyexcel根据模板写入_ProxmoxVE 之 创建win10基础镜像模板
- deepin系统中.txt文件图标显示内容问题_深度系统Deepin 20最新正式版发布:从DDE到应用全面升级-Deepin 20,深度系统 ——快科技(驱动之家旗下媒体)-...
- 为什么每个请求都要有用户名密码呢,那不是每次都要查询一下了,token,表示这个用户已经验证通过了,在token有效期内,只需要判断token是否有效就可以了...
- 计算机英语短文互译,中英文互译的英语短文
- 补偏救弊 | 关于一致性读与语句性能关系的一大误区
- Java NIO问题总结
- 西门子修复因使用第三方组件引起的90多个漏洞
- windows下release模式调试某行代码无法中断
- Confluence或JIRA验证码乱码的问题
- 图像直方图及直方图均衡总结(一)经典方法(附matlab和opencv端算法实现)
- Logisim下载,安装与使用
- 《互联网大厂晋升指南》读书笔记-上
- Xweibo:新浪云微博服务 - 新浪开源微博系统
- Android系统源码编译
- 怎么把动图分解成图片?gif怎么拆分成几张?
- vant组件做表格_有赞团队的vant ui组件库van-field使用
- Excel宏的基本逻辑语句
- 海致大数据京信_海致网聚提出公安大数据背景下的个人计算新理念
- python变量和列表_Python中变量与列表
热门文章
- python基础练习题:棋盘【难度:1级】--景越Python编程实例训练营,不同难度Python习题,适合自学Python的新手进阶
- JS中offsetTop、clientTop、scrollTop、offsetTop各属性介绍
- 风物长还需眼亮,星环助江苏银行大数据弯道超车
- IM品头论足:内存占用谁最省?
- matlab数值拟合r2_用MATLAB求RMSE怎么用MATLAB计算均方误差
- atlbase.h 和 streams.h
- 求100~999的水仙花数(C语言)
- axios 使用详解
- mysql中10049是什么错误_【学习笔记】Oracle数据库10049用于分析SQL解析笔记案例
- 《亮剑》前传《新亮剑》