pandas中有一种分类数据类型category,分类数据类型具有以下优点:

(1)采用这种方式存储数据更加节约内存,提高速度,尤其是数据集中包含很多重复的字符串得时候

(2)当一劣质存在一定的顺序(比如李克特量表)时,应该转换成分类数据

(3)有些python库可以处理分类数据(比如拟合统计模型)

使用astype将数据转换成catecory数据类型可参考astype转换数据类型_我就是一个小怪兽的博客-CSDN博客

 以下给出的参考表中给出了可以再分类series上执行得操作,表格下面是该表格中属性方法举例

分类API
属性或方法 说明
Series.cat.categories 类别
Series.cat.ordered 类别是否有顺序
Series.cat.codes 返回类别的证书代码
Series.cat.rename_categories() 重命名类别
Series.cat.reorder_categories() 对类别重新排序
Series.cat.add_categories() 添加新类别
Series.cat.remove_categories() 删除类别
Series.cat.remove_unused_categories() 删除未使用的类别
Series.cat.set_categories() 设置新类别
Series.cat.as_order() 对类别排序
Series.cat.as_unordered() 是类别无序
import pandas as pd
import seaborn as snstips=sns.load_dataset('tips')
t=tips.head(10)
t.loc[[1,4,7],'total_bill']='missing'
print(t.dtypes)print(t['sex'].cat.categories)

输出结果如下:

total_bill      object
tip            float64
sex           category
smoker        category
day           category
time          category
size             int64
dtype: object
------------------------------------------------
Index(['Male', 'Female'], dtype='object')
[Finished in 1.7s]

分类数据cotegory介绍以及常用API的属性和方法相关推荐

  1. Unity脚本介绍和常用API

    Unity脚本介绍和常用API 脚本介绍 1.脚本 介绍 语法结构 编译过程 2.开发工具 MonoDevelop Visual Studio 3.脚本生命周期 简介 脚本生命周期的阶段 1.初始阶段 ...

  2. 地使用分类数据下载介绍

    http://blog.sina.com.cn/s/blog_670ee7720101c0ng.html 土地使用分类数据下载介绍(land cover)--LUCC/GlobCover/UMD/MO ...

  3. 第60天:js常用访问CSS属性的方法

    一. js 常用访问CSS 属性的方法 我们访问得到css 属性,比较常用的有两种: 1. 利用点语法  box.style.width      box.style.top     点语法可以得到 ...

  4. 详解介绍Selenium常用API的使用--Java语言(史无前例的完整)

    一共分为二十个部分:环境安装之Java.环境安装之IntelliJ IDEA.环境安装之selenium.selenium3浏览器驱动.selenium元素定位.控制浏览器操作.WebDriver常用 ...

  5. C#常用控件属性及方法汇总

    窗体类控件 1.窗体 1.常用属性 (1)Name属性:用来获取或设置窗体的名称,在应用程序中可通过Name属性来引用窗体. (2) WindowState属性: 用来获取或设置窗体的窗口状态. 取值 ...

  6. 字符串的介绍及常用API总结

    本期主要介绍字符串的使用以及常用的API! 目录 一.定义字符串的几种方式 二.字符数组的存储方式 三.sizeof和strlen的区别 四.动态开辟字符串 1.malloc 2.free 3.rea ...

  7. python+selenium——详解介绍Selenium常用API的使用--python语言(完整版)

    参考:http://www.51testing.com/html/03/n-3725703-2.html from selenium import webdriver driver = webdriv ...

  8. php反射API 获取属性/注释/方法 执行方法 实例

    <?phpclass Person {/*** 这里是对$_allowDynamicAttributes的注释信息*/private $_allowDynamicAttributes = fal ...

  9. JsRender 前端渲染模板常用API学习

    JsRender 常用API 1. $.templates() $.templates()方法是用来注册或编译模板的,使用的情况有以下几种. 把html字符串编译编译成模板 获取使用script标签声 ...

最新文章

  1. window.opener.document.getElementById(“a”)用标准的Jquery 语言怎么写
  2. matlab表示时间集合,matlab集合操作
  3. Javascript模拟c#中arraylist操作(学习分享)
  4. python包含html5么_python-HTML(HTML5级别)
  5. django-admin.py startproject HelloWorld创建文件提示invalid syntax
  6. libtorch下载
  7. web of science上查找相关会议和期刊的论文
  8. Salesforce 主要发展历史
  9. 基于python的证件照_利用python自动生成证件照
  10. 谷歌浏览器导致电脑右下角莫名弹出广告解决办法
  11. Code Review流程
  12. 支持向量机:Duality
  13. 项目 | Java+PhantomJs爬虫实战——半次元 下载高清原图
  14. c++除法保留小数_小学数学整数和小数的应用题解答方法公式汇总,新学期必备...
  15. COUNT计算机公式,countif函数的使用方法(统计考勤函数计算公式)
  16. [FPGA/Vivado/ILA]Vivado的ILA核在Waveform界面无任何变化,抓取不到信号和数据
  17. 计算机应用基础试卷分析报告,试卷分析计算机应用基础
  18. 教你如何用一行代码获取免费的QQ气泡框
  19. 这是一款走心的最新测评:英伟达史上最便宜AI硬件抗造不?
  20. 获取Google Play 下载 来源渠道 广告参数 相关数据

热门文章

  1. mysql sql执行效率_一顿操作猛如虎,SQL执行效率提高250
  2. java.lang.AbstractMethodError: dm.jdbc.driver.DmdbConnection.isValid(I)Z
  3. 2017年搜狗校招Java研发笔试编程题
  4. 游戏素材制作篇(一)——使用PR将视频或者动图转化为图片
  5. 网络笔记(29) 容器网络:来去自由的日子,不买公寓去合租
  6. ArcGIS Server 自定义比例尺切图
  7. 推荐算法(一)——音乐歌单智能推荐
  8. 游戏数据后台,kafka代替rsync同步日志数据
  9. HTML元素的水平/垂直居中方式(简单代码和图)
  10. 网页播放器自定义倍速播放