我有一个带有数据的pandas.core.series.Series

0 [00115840, 00110005, 001000033, 00116000...

1 [00267285, 00263627, 00267010, 0026513...

2 [00335595, 00350750]

我想从系列中删除前导零.我试过了

x.astype('int64')

但得到了错误信息

ValueError: setting an array element with a sequence.

你能建议我在python 3.x中怎么做吗?

解决方法:

如果想要将字符串列表转换为整数列表,请使用list comprehension:

s = pd.Series([[int(y) for y in x] for x in s], index=s.index)

s = s.apply(lambda x: [int(y) for y in x])

样品:

a = [['00115840', '00110005', '001000033', '00116000'],

['00267285', '00263627', '00267010', '0026513'],

['00335595', '00350750']]

s = pd.Series(a)

print (s)

0 [00115840, 00110005, 001000033, 00116000]

1 [00267285, 00263627, 00267010, 0026513]

2 [00335595, 00350750]

dtype: object

s = s.apply(lambda x: [int(y) for y in x])

print (s)

0 [115840, 110005, 1000033, 116000]

1 [267285, 263627, 267010, 26513]

2 [335595, 350750]

dtype: object

编辑:

如果只想要整数,你可以将值展平并转换为整数:

s = pd.Series([item for sublist in s for item in sublist]).astype(int)

替代方案:

import itertools

s = pd.Series(list(itertools.chain(*s))).astype(int)

print (s)

0 115840

1 110005

2 1000033

3 116000

4 267285

5 263627

6 267010

7 26513

8 335595

9 350750

dtype: int32

时序:

a = [['00115840', '00110005', '001000033', '00116000'],

['00267285', '00263627', '00267010', '0026513'],

['00335595', '00350750']]

s = pd.Series(a)

s = pd.concat([s]*1000).reset_index(drop=True)

In [203]: %timeit pd.Series([[int(y) for y in x] for x in s], index=s.index)

100 loops, best of 3: 4.66 ms per loop

In [204]: %timeit s.apply(lambda x: [int(y) for y in x])

100 loops, best of 3: 5.13 ms per loop

#cᴏʟᴅsᴘᴇᴇᴅ sol

In [205]: %%timeit

...: v = pd.Series(np.concatenate(s.values.tolist()))

...: v.astype(int).groupby(s.index.repeat(s.str.len())).agg(pd.Series.tolist)

...:

1 loop, best of 3: 226 ms per loop

#Wen solution

In [211]: %timeit pd.Series(s.apply(pd.Series).stack().astype(int).groupby(level=0).apply(list))

1 loop, best of 3: 1.12 s per loop

flatenning的解决方案(@cᴏʟᴅsᴘᴇᴇᴅ的想法):

In [208]: %timeit pd.Series([item for sublist in s for item in sublist]).astype(int)

100 loops, best of 3: 2.55 ms per loop

In [209]: %timeit pd.Series(list(itertools.chain(*s))).astype(int)

100 loops, best of 3: 2.2 ms per loop

#cᴏʟᴅsᴘᴇᴇᴅ sol

In [210]: %timeit pd.Series(np.concatenate(s.values.tolist()))

100 loops, best of 3: 7.71 ms per loop

标签:python,pandas,time-series

python删除所有core文件_python – 从pandas.core.series.Series中删除前导零相关推荐

  1. python dataframe取一列_python - 从pandas DataFrame列标题中获取列表

    python - 从pandas DataFrame列标题中获取列表 我想从pandas DataFrame中获取列标题列表. DataFrame将来自用户输入,因此我不知道将会有多少列或将调用它们. ...

  2. core文件 linux,Linux 下core文件的使用

    转储文件(core dump)本来是在程序运行出错的时候产生的.转储文件记录了进程出错时的内存映像,以及进程执行的上下文环境,如寄存器的值等.它的主要用途是在程序运行崩溃时记录下进程的瞬时情况,从而为 ...

  3. python资源管理器选择文件_Python:在资源管理器中获取选定文件的列表(windows7)...

    我知道现在在这里发布答案有点晚了,但我几个月前尝试过Olav的解决方案,但它没有完全起作用:工作目录是脚本的工作目录,所以我不得不删除if条件才能使其工作,但它选择了所有Windows资源管理器窗口中 ...

  4. python多线程写同一个文件_Python多线程快速写入文件,python,飞速

    Python多线程快速写入文件,python,飞速 发表时间:2020-07-10 乱序多线程写入 举个最简单的例子,只要求快速写入即可,对顺序无要求时: import threading def w ...

  5. python反编译加密文件_python打包的二进制文件反编译

    简介 Pyhton是一个脚本语言,在运行Python代码时,最终由Python解释器来执行.解释器就是Python的运行环境,但是除了开发人员,大部分人在使用时并不会安装Python.所以官方就提供了 ...

  6. python os模块打开文件_Python 文件操作之OS模块

    with open('filepath') as rename: for line in rename: ... with 命令下 不用使用close()函数关闭文件,打开的文件在with 代码块下有 ...

  7. python数据透视表计数去除重复_如何从pandas数据透视表中删除重复值?

    因此,我试图将excel的一组指令复制到python中.问题是我对excel和正在发生的事情知之甚少.在 我有一个数据帧:no. name corrected no. corrected name 0 ...

  8. python import from egg文件_python egg怎么安装

    展开全部 一 setuptools 和easy_install setuptools:setuptools 是一组由PEAK(Python Enterprise Application Kit)开发的 ...

  9. python怎么发送代码文件_python 通过 socket 发送文件的实例代码

    目录结构: client: #!/usr/bin/env python # -*-coding:utf-8 -*- import socket, struct, json download_dir = ...

最新文章

  1. 一个生成全局唯一Sequence ID的高并发工厂类 (Java)
  2. unity3d游戏数据加密
  3. 深度学习(四)卷积神经网络Lenet-5实现
  4. Android中使用AlertDialog实现几种不同的对话框
  5. NYOJ 762 第k个互质数(二分 + 容斥)
  6. Android Animation实现元素在屏幕上按照指定轨迹运动,以及出现NullPointerException的解决方案
  7. .net core 实现基于 JSON 的多语言
  8. CSS--CSS清除浮动的4种方式
  9. 日志输出到文件nacos 配置_python 配置日志输出到终端与文件
  10. 线程池和任务工厂实现多线程异步运行
  11. windows server 2012 --安装远程桌面服务后无法远程的问题
  12. sendmail安全(加密和认证)
  13. 201871010114-李岩松《面向对象程序设计(java)》第四周学习总结
  14. Android设备指纹认证
  15. matlab求解常微分方程的实验,实验五__用matlab求解常微分方程
  16. 为什么说汽车VIN码是汽车唯一的身份证
  17. 十大api接口平台(接口商)
  18. KeyError问题求助
  19. Python 图_系列之纵横对比 Bellman-Ford 和 Dijkstra 最短路径算法
  20. 《图书管理系统——“借书还书”模块》

热门文章

  1. 两个date 相差得到月份_DATE和TIME函数的正确打开方式
  2. hutool的定时任务不支持依赖注入怎么办_「架构」 - 定时任务 amp; Elastic-Job基本使用...
  3. delete hive_「挑战30万年薪」 Hive语句详解之从SQL到HQL的应转习惯
  4. sql 发送邮件网络附件_利用VBA发送附件电子邮件
  5. 更换ip地址_手机怎么改ip地址
  6. bigdecimal不保留小数_金钱要使用BigDecimal数据类型(使用double的已经被公司开除了)...
  7. python 一个列表转字典_python基础语法:列表和字典
  8. 约瑟夫环算法c语言,约瑟夫环的c语言实现(代码已实现)
  9. springboot 接受数组对象_SpringBoot+RabbitMQ 方式收发消息
  10. python杂记(一)