我可以通过使用df.astype()方法转换为’category’来转换pandas数据框中的所有文本功能,如下所示.但是我觉得类别难以使用(例如用于绘制数据),并且更愿意创建一个新的整数列

#convert all objects to categories

object_types = dataset.select_dtypes(include=['O'])

for col in object_types:

dataset['{0}_category'.format(col)] = dataset[col].astype('category')

我可以使用这个hack将文本转换为整数:

#convert all objects to int values

object_types = dataset.select_dtypes(include=['O'])

new_cols = {}

for col in object_types:

data_set = set(dataset[col].tolist())

data_indexed = {}

for i, item in enumerate(data_set):

data_indexed[item] = i

new_list = []

for item in dataset[col].tolist():

new_list.append(data_indexed[item])

new_cols[col]=new_list

for key, val in new_cols.items():

dataset['{0}_int_value'.format(key)] = val

但是有更好的(或现有的)方法吗?

pandas 转换为文本类型_python – pandas将文本特征转换为数值相关推荐

  1. python pandas读取txt文件_python Pandas 读取txt表格的实例

    运行环境 Python 2.7 操作实例 1.原始文本格式:空格分隔的txt,例如 2016-03-22 00:06:24.4463094 中文测试字符 2016-03-22 00:06:32.456 ...

  2. pandas打印全部列_python——pandas练习题1-5

    练习1-开始了解你的数据 探索Chipotle快餐数据 相应数据集:chipotle.tsv import pandas as pd chipo=pd.read_csv("exercise_ ...

  3. python和pandas有什么关系_python pandas效率到底如何?

    在使用Pandas之前,大多数数据分析师已经掌握了Excel和SQL,并且在刚上手Pandas时会经常习惯性想到"老办法"."如果谁能把常用的数据查询语法做个对比就好了 ...

  4. python pandas series加速原理_python pandas中对Series数据进行轴向连接的实例

    有时候我们想要的数据合并结果是数据的轴向连接,在pandas中这可以通过concat来实现.操作的对象通常是Series. Ipython中的交互代码如下: In [17]: from pandas ...

  5. python pandas读取文件内容_python pandas读取大型文件

    数据处理:pandas处理大型csv文件,使用pandas分块处理大文件 1. 读取限定列 一个 csv文件中,有很多列,而我们只关心其中的某些列是,如果把每行数据都读取出来,在提取信息,显然会增加I ...

  6. python pandas合并单元格_python pandas拆分单元格

    python pandas拆分单元格​mp.weixin.qq.com 拆分单元格是excel中经常遇到的内容之一.那么在pandas中如何实现呢? 例如有如下数据: >>> imp ...

  7. python中文文本分析_Python有趣|中文文本情感分析

    前言 前文给大家说了python机器学习的路径,这光说不练假把式,这次,罗罗攀就带大家完成一个中文文本情感分析的机器学习项目,今天的流程如下: 数据情况和处理 数据情况 这里的数据为大众点评上的评论数 ...

  8. python输出文本框_python TKinter获取文本框内容的方法

    python TKinter获取文本框内容的方法 如下所示: #coding:utf-8 import urllib,urllib2 import Tkinter #导入TKinter模块 ytm=T ...

  9. python pandas 数据透视表_python – Pandas数据透视表:列顺序和小计

    小计和 MultiIndex.from_arrays的解决方案.最后 concat和所有数据帧, sort_index并添加所有总和: #replace km/h and convert to int ...

最新文章

  1. Scott Hanselman's 推荐的的实用工具集合(2011版)
  2. java变量只声明未初始化是否可以直接使用?
  3. BigDecimal的使用举例,包括阶乘的相加求法思路
  4. 逆序输出(数组练习)
  5. VTK:几何对象之ParametricSuperToroid
  6. Marble原理之线程中断
  7. ioc spring 上机案例_抛开Spring去理解IOC思想 - 原来IOC容器这么简单
  8. html5中地理位置,Chrome中的HTML 5地理位置提示
  9. 被中国人误传了数千年的七句话
  10. python目录操作函数_Python3目录操作
  11. [paper reading] CornerNet
  12. jmeter 压力测试教程全解
  13. PyQt4开发环境搭建指导
  14. 2021-09-08Cloudera Manager集群报警,堆转储目录/tmp 或日志目录/var/log 可用空间小于 5.0 吉字节
  15. PLC_自动化控制系统_1_简说自动化控制系统
  16. [新闻观察]中国网络“名人博客”风声水起
  17. 【推荐】mysql联合 索引(复合索引)的探讨
  18. 前端人工智能?TensorFlow.js 学会游戏通关
  19. TYPE-C 手机/电脑同时充电直播 视频采集卡方案
  20. 少儿学习硬笔书法的好处,你了解多少?

热门文章

  1. python event对象
  2. 可路由计算引擎实现前置数据库
  3. 深信服 2019校园招聘 研发试卷-2018.09.21
  4. 计算机原理与智能-翻译
  5. jquery 实现购物车的商品总数及价格计算
  6. 零知识 QAP 问题的转化
  7. lateral view 和 lateral view outer的区别
  8. 视频转换横竖屏、去色,视频剪辑
  9. 2022京东年货节全民炸年兽玩法攻略
  10. APP测试基本流程及测试基本点