pandas 转换为文本类型_python – pandas将文本特征转换为数值
我可以通过使用df.astype()方法转换为’category’来转换pandas数据框中的所有文本功能,如下所示.但是我觉得类别难以使用(例如用于绘制数据),并且更愿意创建一个新的整数列
#convert all objects to categories
object_types = dataset.select_dtypes(include=['O'])
for col in object_types:
dataset['{0}_category'.format(col)] = dataset[col].astype('category')
我可以使用这个hack将文本转换为整数:
#convert all objects to int values
object_types = dataset.select_dtypes(include=['O'])
new_cols = {}
for col in object_types:
data_set = set(dataset[col].tolist())
data_indexed = {}
for i, item in enumerate(data_set):
data_indexed[item] = i
new_list = []
for item in dataset[col].tolist():
new_list.append(data_indexed[item])
new_cols[col]=new_list
for key, val in new_cols.items():
dataset['{0}_int_value'.format(key)] = val
但是有更好的(或现有的)方法吗?
pandas 转换为文本类型_python – pandas将文本特征转换为数值相关推荐
- python pandas读取txt文件_python Pandas 读取txt表格的实例
运行环境 Python 2.7 操作实例 1.原始文本格式:空格分隔的txt,例如 2016-03-22 00:06:24.4463094 中文测试字符 2016-03-22 00:06:32.456 ...
- pandas打印全部列_python——pandas练习题1-5
练习1-开始了解你的数据 探索Chipotle快餐数据 相应数据集:chipotle.tsv import pandas as pd chipo=pd.read_csv("exercise_ ...
- python和pandas有什么关系_python pandas效率到底如何?
在使用Pandas之前,大多数数据分析师已经掌握了Excel和SQL,并且在刚上手Pandas时会经常习惯性想到"老办法"."如果谁能把常用的数据查询语法做个对比就好了 ...
- python pandas series加速原理_python pandas中对Series数据进行轴向连接的实例
有时候我们想要的数据合并结果是数据的轴向连接,在pandas中这可以通过concat来实现.操作的对象通常是Series. Ipython中的交互代码如下: In [17]: from pandas ...
- python pandas读取文件内容_python pandas读取大型文件
数据处理:pandas处理大型csv文件,使用pandas分块处理大文件 1. 读取限定列 一个 csv文件中,有很多列,而我们只关心其中的某些列是,如果把每行数据都读取出来,在提取信息,显然会增加I ...
- python pandas合并单元格_python pandas拆分单元格
python pandas拆分单元格mp.weixin.qq.com 拆分单元格是excel中经常遇到的内容之一.那么在pandas中如何实现呢? 例如有如下数据: >>> imp ...
- python中文文本分析_Python有趣|中文文本情感分析
前言 前文给大家说了python机器学习的路径,这光说不练假把式,这次,罗罗攀就带大家完成一个中文文本情感分析的机器学习项目,今天的流程如下: 数据情况和处理 数据情况 这里的数据为大众点评上的评论数 ...
- python输出文本框_python TKinter获取文本框内容的方法
python TKinter获取文本框内容的方法 如下所示: #coding:utf-8 import urllib,urllib2 import Tkinter #导入TKinter模块 ytm=T ...
- python pandas 数据透视表_python – Pandas数据透视表:列顺序和小计
小计和 MultiIndex.from_arrays的解决方案.最后 concat和所有数据帧, sort_index并添加所有总和: #replace km/h and convert to int ...
最新文章
- Scott Hanselman's 推荐的的实用工具集合(2011版)
- java变量只声明未初始化是否可以直接使用?
- BigDecimal的使用举例,包括阶乘的相加求法思路
- 逆序输出(数组练习)
- VTK:几何对象之ParametricSuperToroid
- Marble原理之线程中断
- ioc spring 上机案例_抛开Spring去理解IOC思想 - 原来IOC容器这么简单
- html5中地理位置,Chrome中的HTML 5地理位置提示
- 被中国人误传了数千年的七句话
- python目录操作函数_Python3目录操作
- [paper reading] CornerNet
- jmeter 压力测试教程全解
- PyQt4开发环境搭建指导
- 2021-09-08Cloudera Manager集群报警,堆转储目录/tmp 或日志目录/var/log 可用空间小于 5.0 吉字节
- PLC_自动化控制系统_1_简说自动化控制系统
- [新闻观察]中国网络“名人博客”风声水起
- 【推荐】mysql联合 索引(复合索引)的探讨
- 前端人工智能?TensorFlow.js 学会游戏通关
- TYPE-C 手机/电脑同时充电直播 视频采集卡方案
- 少儿学习硬笔书法的好处,你了解多少?