我有一个pandas数据帧,我正在尝试将字符串表示的给定列中的值更改为整数.例如:

df = index fruit quantity price

0 apple 5 0.99

1 apple 2 0.99

2 orange 4 0.89

4 banana 1 1.64

...

10023 kiwi 10 0.92

我想看看:

df = index fruit quantity price

0 1 5 0.99

1 1 2 0.99

2 2 4 0.89

4 3 1 1.64

...

10023 5 10 0.92

我可以这样做

df["fruit"] = df["fruit"].map({"apple": 1, "orange": 2,...})

如果我有一个小的列表要改变,这是有效的,但我正在看一个有500多个不同标签的专栏.有没有办法将其从字符串更改为int?

df.fruit = pd.factorize(df.fruit)[0]

print (df)

fruit quantity price

0 0 5 0.99

1 0 2 0.99

2 1 4 0.89

3 2 1 1.64

4 3 10 0.92

df.fruit = pd.Categorical(pd.factorize(df.fruit)[0])

print (df)

fruit quantity price

0 0 5 0.99

1 0 2 0.99

2 1 4 0.89

3 2 1 1.64

4 3 10 0.92

print (df.dtypes)

fruit category

quantity int64

price float64

dtype: object

如果需要从1开始计数:

df.fruit = pd.Categorical(pd.factorize(df.fruit)[0] + 1)

print (df)

fruit quantity price

0 1 5 0.99

1 1 2 0.99

2 2 4 0.89

3 3 1 1.64

4 4 10 0.92

python改变字符串类型_python – Sklearn将字符串类标签更改为int相关推荐

  1. python定义字符串类型_Python数据类型之字符串

    1. Python字符串的创建 字符串是Python中最常见的数据类型,通常使用单引号或双引号来定义一个字符串,如下: str = "我是字符串" str1 = '我也是字符串' ...

  2. Python将字符串类标签更改为int

    在对数据集预处理时,需要将标签值替换为[0,1,2,...],可使用一下方法更改 尤其使用XGBClassifier,必须将标签转换 1. 手动使用map rice["CLASS" ...

  3. python字符串类型_python字符串类型介绍

    一. 字符串的写法 1.单引号或双引号 二. 字符串是不会变的 1.字符串不会变,只会新增后再赋值 a = 'ABC' b = a a = 'XYZ' print(b) 结果还是ABC 三. 字符串的 ...

  4. python字典中的值只能是字符串类型_python字典key不能是可以是啥类型

    python中字典的key不能是可变类型.字典可存储任意类型对象,其中值可以取任何数据类型,但键必须是不可变的,如字符串.数字或元组.语法格式:[d = {key1 : value1, key2 : ...

  5. python不支持单字符类型_Python数据类型之字符串

    1. Python字符串的创建 字符串是Python中最常见的数据类型,通常使用单引号或双引号来定义一个字符串,如下: str = "我是字符串" str1 = '我也是字符串' ...

  6. python字符串解释_Python学习:字符串的简单解释,深入浅出

    字符串是python很常见的一种数据类型,比如日志的打印,程序中函数的注释,数据库的访问,变量的操作都需要用到字符串. 一.字符串基础 字符串是由独立字符组成的一个序列,通常包含在单引号('')双引号 ...

  7. python字符串输入_python如何输入字符串

    字符串是 Python 中最常用的数据类型.我们可以使用引号( ' 或 " )来创建字符串. 创建字符串很简单,只要为变量分配一个值即可.例如:var1 = 'Hello World!' v ...

  8. python 定义字符串变量_Python变量和字符串详解

    几个月前,我开始学习个人形象管理,从发型.妆容.服饰到仪表仪态,都开始做全新改造,在塑造个人风格时,最基础的是先了解自己属于哪种风格,然后找到参考对象去模仿,可以是自己欣赏的人.明星或模特等,直至最后 ...

  9. python中文字符串编码_python中文乱码 字符串和编码

    Unicode把所有语言都统一到一套编码里,这样就不会再有乱码问题了. Unicode标准也在不断发展,但最常用的是用两个字节表示一个字符(如果要用到非常偏僻的字符,就需要4个字节).现代操作系统和大 ...

最新文章

  1. 洗礼灵魂,修炼python(85)-- 知识拾遗篇 —— 深度剖析让人幽怨的编码
  2. 利用SIFT和RANSAC算法(openCV框架)实现物体的检测与定位,并求出变换矩阵(findFundamentalMat和findHomography的比较)
  3. Adobe Acrobat Reader 快捷键
  4. 知识管理促进企业组织能力提升
  5. C#如何用正则表达式截取https和带端口的域名
  6. 5G的来龙去脉及未来
  7. python 字符串格式化%s_Python字符串格式化%s%d%f详解
  8. Cent Os下安装软件之---源码安装
  9. 常用语料库语言学相关软件下载
  10. 简单的嵌入式人脸识别系统
  11. 编程器测试软件,CH341A编程器
  12. 可查看抖音各项数据的软件有哪些?99%的人可能不知道这3款
  13. 冒泡排序java简单实现
  14. 路由器中继模式WISP、Client + AP、AP模式的区别和适使用场景
  15. 如何查看连接过的WiFi密码?详细教程(配图片)!
  16. 两年后再次遇到的Oracle启动报错,ORA-01012:not logged
  17. redhat 6.5安装oracle时出现java异常,redhat6.5 下安装 oracle11 报错
  18. 国内手机验证码短信平台哪个好用?关键在于这4个标准!
  19. 女程序员南漂3年:有种心酸叫孤单的人总是晚回家
  20. 如何解除任务管理器被禁用

热门文章

  1. Amazon Aurora Serverless MySQL已正式可用
  2. 程序员必须掌握的英语单词
  3. react-native 环境配置遇到的问题
  4. Bootstrap3系列:下拉菜单
  5. 记我的一次电话面试 (转)
  6. 生产服务器环境最小化安装后Centos 6.5优化配置备忘
  7. 拽 Excel 到 ComponentOne C1FlexGrid
  8. 直方图和直条图_绘图专题 | 条形图/直方图傻傻分不清楚
  9. vue 的elementui中select下拉框多选项-multiple属性
  10. go执行二进制文件的方法:通过shell脚本来调用二进制文件,直接执行go的二进制文件会存在参数传递问题