python改变字符串类型_python – Sklearn将字符串类标签更改为int
我有一个pandas数据帧,我正在尝试将字符串表示的给定列中的值更改为整数.例如:
df = index fruit quantity price
0 apple 5 0.99
1 apple 2 0.99
2 orange 4 0.89
4 banana 1 1.64
...
10023 kiwi 10 0.92
我想看看:
df = index fruit quantity price
0 1 5 0.99
1 1 2 0.99
2 2 4 0.89
4 3 1 1.64
...
10023 5 10 0.92
我可以这样做
df["fruit"] = df["fruit"].map({"apple": 1, "orange": 2,...})
如果我有一个小的列表要改变,这是有效的,但我正在看一个有500多个不同标签的专栏.有没有办法将其从字符串更改为int?
df.fruit = pd.factorize(df.fruit)[0]
print (df)
fruit quantity price
0 0 5 0.99
1 0 2 0.99
2 1 4 0.89
3 2 1 1.64
4 3 10 0.92
df.fruit = pd.Categorical(pd.factorize(df.fruit)[0])
print (df)
fruit quantity price
0 0 5 0.99
1 0 2 0.99
2 1 4 0.89
3 2 1 1.64
4 3 10 0.92
print (df.dtypes)
fruit category
quantity int64
price float64
dtype: object
如果需要从1开始计数:
df.fruit = pd.Categorical(pd.factorize(df.fruit)[0] + 1)
print (df)
fruit quantity price
0 1 5 0.99
1 1 2 0.99
2 2 4 0.89
3 3 1 1.64
4 4 10 0.92
python改变字符串类型_python – Sklearn将字符串类标签更改为int相关推荐
- python定义字符串类型_Python数据类型之字符串
1. Python字符串的创建 字符串是Python中最常见的数据类型,通常使用单引号或双引号来定义一个字符串,如下: str = "我是字符串" str1 = '我也是字符串' ...
- Python将字符串类标签更改为int
在对数据集预处理时,需要将标签值替换为[0,1,2,...],可使用一下方法更改 尤其使用XGBClassifier,必须将标签转换 1. 手动使用map rice["CLASS" ...
- python字符串类型_python字符串类型介绍
一. 字符串的写法 1.单引号或双引号 二. 字符串是不会变的 1.字符串不会变,只会新增后再赋值 a = 'ABC' b = a a = 'XYZ' print(b) 结果还是ABC 三. 字符串的 ...
- python字典中的值只能是字符串类型_python字典key不能是可以是啥类型
python中字典的key不能是可变类型.字典可存储任意类型对象,其中值可以取任何数据类型,但键必须是不可变的,如字符串.数字或元组.语法格式:[d = {key1 : value1, key2 : ...
- python不支持单字符类型_Python数据类型之字符串
1. Python字符串的创建 字符串是Python中最常见的数据类型,通常使用单引号或双引号来定义一个字符串,如下: str = "我是字符串" str1 = '我也是字符串' ...
- python字符串解释_Python学习:字符串的简单解释,深入浅出
字符串是python很常见的一种数据类型,比如日志的打印,程序中函数的注释,数据库的访问,变量的操作都需要用到字符串. 一.字符串基础 字符串是由独立字符组成的一个序列,通常包含在单引号('')双引号 ...
- python字符串输入_python如何输入字符串
字符串是 Python 中最常用的数据类型.我们可以使用引号( ' 或 " )来创建字符串. 创建字符串很简单,只要为变量分配一个值即可.例如:var1 = 'Hello World!' v ...
- python 定义字符串变量_Python变量和字符串详解
几个月前,我开始学习个人形象管理,从发型.妆容.服饰到仪表仪态,都开始做全新改造,在塑造个人风格时,最基础的是先了解自己属于哪种风格,然后找到参考对象去模仿,可以是自己欣赏的人.明星或模特等,直至最后 ...
- python中文字符串编码_python中文乱码 字符串和编码
Unicode把所有语言都统一到一套编码里,这样就不会再有乱码问题了. Unicode标准也在不断发展,但最常用的是用两个字节表示一个字符(如果要用到非常偏僻的字符,就需要4个字节).现代操作系统和大 ...
最新文章
- 洗礼灵魂,修炼python(85)-- 知识拾遗篇 —— 深度剖析让人幽怨的编码
- 利用SIFT和RANSAC算法(openCV框架)实现物体的检测与定位,并求出变换矩阵(findFundamentalMat和findHomography的比较)
- Adobe Acrobat Reader 快捷键
- 知识管理促进企业组织能力提升
- C#如何用正则表达式截取https和带端口的域名
- 5G的来龙去脉及未来
- python 字符串格式化%s_Python字符串格式化%s%d%f详解
- Cent Os下安装软件之---源码安装
- 常用语料库语言学相关软件下载
- 简单的嵌入式人脸识别系统
- 编程器测试软件,CH341A编程器
- 可查看抖音各项数据的软件有哪些?99%的人可能不知道这3款
- 冒泡排序java简单实现
- 路由器中继模式WISP、Client + AP、AP模式的区别和适使用场景
- 如何查看连接过的WiFi密码?详细教程(配图片)!
- 两年后再次遇到的Oracle启动报错,ORA-01012:not logged
- redhat 6.5安装oracle时出现java异常,redhat6.5 下安装 oracle11 报错
- 国内手机验证码短信平台哪个好用?关键在于这4个标准!
- 女程序员南漂3年:有种心酸叫孤单的人总是晚回家
- 如何解除任务管理器被禁用
热门文章
- Amazon Aurora Serverless MySQL已正式可用
- 程序员必须掌握的英语单词
- react-native 环境配置遇到的问题
- Bootstrap3系列:下拉菜单
- 记我的一次电话面试 (转)
- 生产服务器环境最小化安装后Centos 6.5优化配置备忘
- 拽 Excel 到 ComponentOne C1FlexGrid
- 直方图和直条图_绘图专题 | 条形图/直方图傻傻分不清楚
- vue 的elementui中select下拉框多选项-multiple属性
- go执行二进制文件的方法:通过shell脚本来调用二进制文件,直接执行go的二进制文件会存在参数传递问题