我的数据框看起来像这样,只是更大.

d = {'Col_1' : pd.Series(['A', 'B']),

'Col_2' : pd.Series(['B', 'A', 'C']),

'Col_3' : pd.Series(['B', 'A']),

'Col_4' : pd.Series(['C', 'A', 'B', 'D']),

'Col_5' : pd.Series(['A', 'C']),}

df = pd.DataFrame(d)

Col_1 Col_2 Col_3 Col_4 Col_5

A B B C A

B A A A C

NaN C NaN B NaN

NaN NaN NaN D NaN

首先,我试图单独对每列进行排序.我尝试过类似的东西:df.sort([lambda x:x in df.columns],axis = 1,ascending = True,inplace = True)但是最终只有错误.如何对每个列进行单独排序,最终得到如下结果:

Col_1 Col_2 Col_3 Col_4 Col_5

A A A A A

B B B B C

NaN C NaN C NaN

NaN NaN NaN D NaN

其次,我希望连接列中的行

df = pd.concat([df,pd.DataFrame(df.sum(axis=0),columns=['Concatenation']).T])

在用”替换np.nan之后,我可以将所有内容与上面的行组合在一起,但结果会一起被粉碎(‘AB’)并需要额外的步骤来清理(像’A:B’之类的东西).

解决方法:

这是一种方式:

>>> pandas.concat([df[col].order().reset_index(drop=True) for col in df], axis=1, ignore_index=True)

11: 0 1 2 3 4

0 A A A A A

1 B B B B C

2 NaN C NaN C NaN

3 NaN NaN NaN D NaN

[4 rows x 5 columns]

但是,你所做的有点奇怪. DataFrames不仅仅是不相关列的集合.在DataFrame中,每一行代表一条记录,因此一列中的值在语义上与同一行中其他列中的值相关联.通过独立地对列进行排序,您将丢弃此信息,因此行现在毫无意义.这就是我的例子中需要reset_index的原因.此外,正因为如此,没有办法就地执行此操作,您的示例建议您这样做.

标签:python,dataframe,pandas

python pandas 排序_python – pandas:单独对每列进行排序相关推荐

  1. python dataframe排序_python – Pandas DataFrame排序忽略了这种情况

    我在 Python中有一个Pandas数据帧.数据帧的内容来自 here.我稍微修改了"单个"列中第一个字母的大小写.这是我有的: import pandas as pd df = ...

  2. python 组内排序_python - pandas groupby在组内排序

    python - pandas groupby在组内排序 我想将数据框分组为两列,然后对组内的聚合结果进行排序. In [167]: df Out[167]: count job source 0 2 ...

  3. python agg函数_Python Pandas Series.agg()用法及代码示例

    Python是进行数据分析的一种出色语言,主要是因为以数据为中心的python软件包具有奇妙的生态系统. Pandas是其中的一种,使导入和分析数据更加容易. Pandas Series.agg()用 ...

  4. python endswith函数_Python Pandas Series.str.endswith()用法及代码示例

    Python是进行数据分析的一种出色语言,主要是因为以数据为中心的Python软件包具有奇妙的生态系统. Pandas是其中的一种,使导入和分析数据更加容易. Pandas endswith()是在系 ...

  5. python pandas 教程_Python pandas十分钟教程

    本文首发于公众号<深度学习与Python> Pandas是数据处理和数据分析中最流行的Python库.本文将为大家介绍一些有用的Pandas信息,介绍如何使用Pandas的不同函数进行数据 ...

  6. python效率计算公式_Python: Pandas运算的效率探讨以及如何选择高效的运算方式

    本文就Pandas的运行效率作一个对比的测试,来探讨用哪些方式,会使得运行效率较好. 测试环境如下: windows 7, 64位 python 3.5 pandas 0.19.2 numpy 1.1 ...

  7. python duplicated函数_Python Pandas Dataframe.duplicated()用法及代码示例

    Python是进行数据分析的一种出色语言,主要是因为以数据为中心的python软件包具有奇妙的生态系统. Pandas是其中的一种,使导入和分析数据更加容易. 数据分析的重要部分是分析重复值并将其删除 ...

  8. python findall用法_Python Pandas Series.str.findall()用法及代码示例

    Python是进行数据分析的一种出色语言,主要是因为以数据为中心的Python软件包具有奇妙的生态系统. Pandas是其中的一种,使导入和分析数据更加容易. Pandas str.findall() ...

  9. python startswith函数_Python Pandas Series.str.startswith()用法及代码示例

    Python是进行数据分析的一种出色语言,主要是因为以数据为中心的Python软件包具有奇妙的生态系统. Pandas是其中的一种,使导入和分析数据更加容易. Pandas startswith()是 ...

最新文章

  1. 不上全站https的网站你们就等着被恶心死吧
  2. JavaScript splice() 方法
  3. PAT L3-002. 堆栈
  4. express运行原理
  5. Kraken2 物种序列比对 注释
  6. 【Java 并发编程】线程锁机制 ( 悲观锁 | 乐观锁 | CAS 三大问题 | ABA 问题 | 循环时间长问题 | 多个共享变量原子性问题 )
  7. vue项目中z-index不起作用(将vue实例挂在到window上面)
  8. Github+docsify打造在线文档网站
  9. Z-Stack Home Developer's Guide—2. Overview中文翻译【Z-Stack Home 1.2.0开发文档】
  10. python运维开发之第九天
  11. Redis实现计数器---接口防刷---升级版(Redis+Lua)
  12. gravity和layout_gravity
  13. Python 数据可视化之matpotlib画图
  14. 【物联网】阿里云iot物联网平台监控设备 在线离线状态 解决方案
  15. python-电脑时间校准
  16. 程序读写时间内存 硬盘 cache 访问速度数级对比
  17. 可视化大屏“华而不实”?了解数据可视化的重点!
  18. linux如何给脚本等创建一个桌面启动图标
  19. JS 计算时间差(月份差、天数差)
  20. App优化以及内存泄漏溢出优化

热门文章

  1. 第七章:在Spark集群上使用文件中的数据加载成为graph并进行操作(3)
  2. 大华的支持rtmp推流吗_RTSP安防摄像机(海康大华宇视等)如何推送到RTMP流媒体服务器进行直播...
  3. mysql数据库事务隔离级别是_数据库事务隔离级别-MySQL为例 · Sean
  4. Java线程池实现音频播放
  5. CSDN中最全python字典和实例,让你轻松掌握
  6. origin如何绘制双y轴曲线_Origin对曲线进行多峰拟合
  7. android蓝牙聊天设备,Android蓝牙开发——实现蓝牙聊天
  8. eclipse工程运行正常但是工程有红叉的问题
  9. Java讲课笔记33:多线程概述与线程创建
  10. 大数据学习笔记40:Hive - 内置函数(3)