数据框(DataFrame)是pandas中一种重要的数据结构,你可以将其想象为一个关系型数据表格,其中包含多个行和已命名的列。可以通过字典的方式创建DataFrame,示例代码如下:

import pandas as pdcity_names = pd.Series(['San Francisco', 'San Jose', 'Sacramento'])
population = pd.Series([852469, 1015785, 485199])cities = pd.DataFrame({ 'City name': city_names, 'Population': population })

我们打印cities,可以看到DataFrame的内容如下:

print(citys)
       City name  Population
0  San Francisco      852469
1       San Jose     1015785
2     Sacramento      485199

下面进入本次介绍的主要内容。DataFrame有一个属性被称为index,该属性会向DataFrame的每一行赋一个标识符值。默认情况下,在构造DataFrame时,pandas会赋给每一行0,1,2,3··· 这样的索引值。而且索引值在创建后是稳定的,也就是说,它们不会因为数据重新排序而发生改变。

通过上面一番解释,我们就会明白索引值与相应行的内容在一开始就绑定好了,所以我们要想随机对行进行排序,只需要打乱索引值的顺序即可。我们可以这样做:

cities.reindex([2, 0, 1])

通过DataFrame的reindex方法实现改变行的排序。但是通过这种方法只能实现特定方式的排序,并不能任意打乱,要实现随机任意排序,还需要借助numpy中的 random.permutation 函数。

import numpy as npcities.reindex(np.random.permutation(cities.index))

最后还需要注意一点,通过上面的命令只是输出了乱序之后的中间数据框,并非cities本身,要实现彻底改变cities本身的行排序,不要忘记还需要将乱序后的中间DataFrame赋值给cities,如下:

cities = cities.reindex(np.random.permutation(cities.index))

随机打乱数据框DataFrame中行的顺序相关推荐

  1. dataframe数组做元素_数组 array 矩阵 list 数据框 dataframe

    #R语言备忘录三# #数组array和矩阵matrix.列表list.数据框dataframe #数组 #数组的重要属性就是dim,维数 #得到4*5的矩阵 z dim(z) z #构建数组 x #三 ...

  2. excel取整数的函数_函数010 EXCEL如何随机打乱数据,不重复随机数来帮忙!

    今天我们继续学习我们函数实战系列!一个不小心,我们已经更新9期了,今天就是第十期!具体讲点啥? 第十期-生成随机不重复数据! 顺势我们把相关的随机函数也学习一下,一举两得! 在EXCEL的中,要生成随 ...

  3. Python数据框DataFrame的数据筛选

    [小白从小学Python.C.Java] [Python全国计算机等级考试] [Python数据分析考试必会题] ● 标题与摘要 Python数据框DataFrame的 数据筛选 ● 选择题 关于数据 ...

  4. 【python-numpy 】中的随机打乱数据方法np.random.shuffle

    描述: shuffle() 方法将序列的所有元素随机排序. #实验可得每次shuffle后数据都被打乱,这个方法可以在机器学习训练 #的时候在每个epoch结束后将数据重新洗牌进入下一个epoch的学 ...

  5. R 语言之数据框dataframe和tibble

    文章目录 学习目标 学习内容 dataframe的具体使用 dataframe和 tibble的区别 小结 学习目标 我们所采用的学习内容来自B站的Lizongzhang老师的R语言的学习分享 今天学 ...

  6. 随机打乱数据的几种方式

    基于pytorch indices = torch.randperm(len(dataset)).tolist() dataset = torch.utils.data.Subset(dataset, ...

  7. dataframe转化为array_Pandas入门教程:如何将列表转化成数据框?

    Pandas模块提供了处理数据.数据分析的各种功能.Pandas主要有两种数据结构:Series和DataFrame.本文将介绍一下将一个或者多个列表(list)转化成数据框(DataFrame)的方 ...

  8. python数据框常用操作_转载:python数据框的操作

    我们接着上次分享给大家的两篇文章:Python数据分析之numpy学习(一)和Python数据分析之numpy学习(二),继续讨论使用Python中的pandas模块进行数据分.在接下来的两期pand ...

  9. python 数据框按行拼接_使用python进行数据分析

    Python常用的两类数据分析包:numpy.pandas 一.一维数据分析 (1)numpy数据包的导入.一维数据组的赋值与查询 (2)numpy一维数据与列表的区别 1.可以用来实现统计功能 如计 ...

最新文章

  1. Hadoop的学习前奏(一)——在Linux上安装与配置Hadoop
  2. easyexcel根据模板写入_ProxmoxVE 之 创建win10基础镜像模板
  3. deepin系统中.txt文件图标显示内容问题_深度系统Deepin 20最新正式版发布:从DDE到应用全面升级-Deepin 20,深度系统 ——快科技(驱动之家旗下媒体)-...
  4. 为什么每个请求都要有用户名密码呢,那不是每次都要查询一下了,token,表示这个用户已经验证通过了,在token有效期内,只需要判断token是否有效就可以了...
  5. 计算机英语短文互译,中英文互译的英语短文
  6. 补偏救弊 | 关于一致性读与语句性能关系的一大误区
  7. Java NIO问题总结
  8. 西门子修复因使用第三方组件引起的90多个漏洞
  9. windows下release模式调试某行代码无法中断
  10. Confluence或JIRA验证码乱码的问题
  11. 图像直方图及直方图均衡总结(一)经典方法(附matlab和opencv端算法实现)
  12. Logisim下载,安装与使用
  13. 《互联网大厂晋升指南》读书笔记-上
  14. Xweibo:新浪云微博服务 - 新浪开源微博系统
  15. Android系统源码编译
  16. 怎么把动图分解成图片?gif怎么拆分成几张?
  17. vant组件做表格_有赞团队的vant ui组件库van-field使用
  18. Excel宏的基本逻辑语句
  19. 海致大数据京信_海致网聚提出公安大数据背景下的个人计算新理念
  20. python变量和列表_Python中变量与列表

热门文章

  1. python基础练习题:棋盘【难度:1级】--景越Python编程实例训练营,不同难度Python习题,适合自学Python的新手进阶
  2. JS中offsetTop、clientTop、scrollTop、offsetTop各属性介绍
  3. 风物长还需眼亮,星环助江苏银行大数据弯道超车
  4. IM品头论足:内存占用谁最省?
  5. matlab数值拟合r2_用MATLAB求RMSE怎么用MATLAB计算均方误差
  6. atlbase.h 和 streams.h
  7. 求100~999的水仙花数(C语言)
  8. axios 使用详解
  9. mysql中10049是什么错误_【学习笔记】Oracle数据库10049用于分析SQL解析笔记案例
  10. 《亮剑》前传《新亮剑》