Pandas首个全新主要发行版本包含许多重要功能:更完善的数据框自动汇总、更全面的输出格式、全新的数据类型以及文档站点。作者:读芯术

注意:Pandas 1.0.0rc已于1月9日发布,先前的版本为0.25。

在全新的文档站点上,可以找到完整的发行说明,但小芯认为,技术含量较低的概述也会有所帮助。

用户可以使用 pip升级Pandas,以便使用其新版本。在撰写本文时,Pandas1.0仍然是候选版本,这意味着要安装Pandas1.0需要明确指定其版本。

pip install --upgradepandas==1.0.0rc0 

当然,更新可能会破坏某些代码,因为这是主要版本的发布,因此请务必小心! 此版本的Pandas不再支持Python 2。运行Pandas 1.0+至少需要Python 3.6+,因此请确保使用合适版本的pip 和python。

$ pip --version pip 19.3.1 from /usr/local/lib/python3.7/site-packages/pip (python 3.7)$ python--version Python 3.7.5 

用户可以确认一切正常,并且Pandas使用的是正确版本。

>>> import pandas as pd >>> pd.__version__ 1.0.0rc0 

使用DataFrame.info更好的自动汇总

笔者最喜欢的新功能是优化之后的DataFrame.info法。现在,它使用了更具可读性的格式,从而使数据探索过程更加容易。

>>> df = pd.DataFrame({ ...:   'A': [1,2,3],  ...:   'B': ["goodbye","cruel", "world"],  ...:   'C': [False, True, False] ...:}) >>> df.info()  RangeIndex: 3 entries, 0 to 2 Data columns (total 3 columns):  #  Column  Non-Null Count  Dtype ---  ------  --------------  -----  0  A       3 non-null      int64  1  B       3 non-null      object  2  C       3 non-null      object dtypes: int64(1), object(2) memory usage: 200.0+ bytes 

Markdown表的输出格式

其次,笔者最喜欢的功能是使用新的 DataFrame.to_markdown 法将数据帧导出到Markdown表中。

>>> df.to_markdown() |    |  A | B       | C     | |---:|----:|:--------|:------| |  0 |  1 | goodbye | False | |  1 |  2 | cruel   | True  | |  2 |  3 | world   | False | 

这样一来,通过github gists在Medium等地方显示表格更加便捷。

booleans and strings的新数据类型

来源:Pexels

Pandas1.0还为booleans and strings引入了实验数据类型。

由于这些更改是实验性的,数据类型的API可能会稍有更改,因此应谨慎使用。但是Pandas建议在合理的地方使用这些数据类型,将来的版本将完善诸如regex匹配之类的特定于类型的操作性能。

默认情况下,Pandas不会自动将数据强制转换为这些类型。但是,如果明确指示Pandas,仍然可以使用它们。

>>> B =pd.Series(["goodbye", "cruel", "world"],dtype="string") >>> C = pd.Series([False, True, False], dtype="bool") >>> df.B = B, df.C = C >>> df.info()  RangeIndex: 3 entries, 0 to 2 Data columns (total 3 columns):  #  Column  Non-Null Count  Dtype ---  ------  --------------  -----  0  A       3 non-null      int64  1  B       3 non-null      string  2  C       3 non-null      bool dtypes: int64(1), object(1), string(1) memory usage: 200.0+ bytes 

注意Dtype列现在如何反应新类型的string和bool。

新字符串dtype最实用的优势在于,可以从DataFrame中选择string列。这样可以更快地仅对数据集的文本成分进行分析。

df.select_dtypes("string") 

以前,只能通过显式使用其名称来选择string类型列。

从今天开始,掌握Pandas 1.0的主要功能,全新优化开启使用吧~

python dataframe float转string_盘点Python:Pandas1.0的主要功能相关推荐

  1. python常用模块教程_盘点Python常用的模块和包

    模块 1.定义 计算机在开发过程中,代码越写越多,也就越难以维护,所以为了编写可维护的代码,我们会把函数进行分组,放在不同的文件里.在python里,一个.py文件就是一个模块. 2.优点: 提高代码 ...

  2. python中float转int_在python中将float转换为int的有效方式是什么?

    用时间测试: $bin/python -mtimeit -n10000000 -s 'n = 1.345' 'int(n)' 10000000 loops, best of 3: 0.234 usec ...

  3. Python dataframe绘制饼图_【python可视化】:matplotlib:常见图表绘制——面积图、填图、饼图...

    •本文字数:约620字•阅读时长:约2分钟•难度:1颗星 斑点鱼将Matplotlib分为五部分: 图表窗口设置.图表基本元素及图表输出.图表样式参数.子图创建.常见图表绘制 本文讲第五部分:matp ...

  4. python dataframe去掉索引_关于python:删除具有重复索引的行(Pandas DataFrame和TimeSeries)...

    我正在从网上阅读一些自动天气数据. 观察每5分钟发生一次,并编译成每个气象站的月度文件. 一旦我完成了解析文件,DataFrame看起来像这样: Sta  Precip1hr  Precip5min ...

  5. python dataframe的某一列变为list_Python数据分析系列文章之Pandas(上)

    本篇是[机器学习与数据挖掘]头条号原创首发Python数据分析系列文章的第三篇 Python数据分析系列文章之Python基础篇 Python数据分析系列文章之Numpy Python数据分析系列文章 ...

  6. python dataframe 计算上下两行的差值_用Python进行数据清洗!

    导读:数据清洗是数据分析的必备环节,在进行分析过程中,会有很多不符合分析要求的数据,例如重复.错误.缺失.异常类数据. Python资源共享群:626017123 01 重复值处理 数据录入过程.数据 ...

  7. python语言入门教程-菜鸟学Python入门教程大盘点|7个多月的心血总结

    原标题:菜鸟学Python入门教程大盘点|7个多月的心血总结 阅读本文大概需要5分钟 菜鸟学python已经写了70几篇,入门的教程已经快写完了,我把入门的文章整理了一下,下面是入门篇的一些总结,也是 ...

  8. python打印自动换行如何解决_解决python DataFrame 打印结果不换行问题

    解决python DataFrame 打印结果不换行问题 如下所示: 加入代码: pd.set_option('display.width', 5000) 补充知识:Python 实现不换行打印字符的 ...

  9. 【Python基础】盘点 Python 10 大常用数据结构(上篇)

    我的施工之路 上图施工计划,已完成专题: 1我的施工计划 2数字专题 3字符串专题 4列表专题 5流程控制专题 6编程风格专题 7函数使用 8.面向对象编程(上篇) 9.面向对象编程(下篇) Pyth ...

最新文章

  1. 57条经验之谈 转载(非常不错,我收藏了)
  2. JSP和Tag之文件上传
  3. 语言常用c100单词,英语口语练习_夏普新款PW-C100-G电子词典测评_沪江英语
  4. C++基础与深度解析第一章:C++初探笔记
  5. Java 里面 final 与 static
  6. 张亚勤新作《变革中的思索》谈高科技人才管理
  7. Mac OS X:解决开机总是显示“电脑关机是因为发生了问题”
  8. C++之log4cpp库
  9. 如何用安卓手机运行Python代码
  10. 读《人工智能,李开复王咏刚》
  11. 必须重启计算机才能关闭用户账户控制,Win10系统怎么彻底关闭用户帐户控制?...
  12. matlab中marker太密,markersize_想问下MATLAB里 ‘Markersize’ 设置的值是‘Marker_
  13. 数据加密-国密SM2对数据进行加解密
  14. Mac如何找到和清理微信和QQ的缓存文件
  15. 微信小程序wx:key使用
  16. 获取客户端真实ip的方法
  17. [FreeBSD] pf+altq实战[转]
  18. QT注册登录以及安装问题
  19. 问道账号服务器已满,服务器人数已满 《问道》手游不删档首日战况
  20. 跨境电商注册义乌个体户结汇怎么开户

热门文章

  1. JavaScript ES6对Proxy的原生支持的一个例子
  2. Settype COM_TA_MANUFAC - mapping between ERP Equipment and CRM Individual Object
  3. CRM Fiori和Marketing Cloud里的My Account和All Account
  4. 利用ABAP调试器脚本修改数据库表的值
  5. SAP CRM One Order里item quantity和CUMULAT_H的联动
  6. 如何修改PHP项目Language Library版本号
  7. 使用xslt批量修改xml 节点name
  8. Committee和Virtual Project Team的关系
  9. 如何在Kubernetes里给PostgreSQL创建secret
  10. 如何在Ubuntu里安装Helm