数据科学中经常出现的标签为文本型的,因为需要转化为数值型,以便后续处理。

参考一、

get_dummies 是利用pandas实现one hot encode的方式。详细参数请查看官方文档
  官方文档在这里

get_dummies 前:

  get_dummies 后:

另:pd.get_dummies(df.color)

df = df.join(pd.get_dummies(df.color))

参考二、

利用pandas的Categorical()

import pandas as pd

c = ['A','A','A','B','B','C','C','C','C']

category = pd.Categorical(c)

print category.codes

参考三、

利用 sklearn

from sklearn.preprocessing import LabelEncoder

le = LabelEncoder()

le.fit([1,5,67,100])

le.transform([1,1,100,67,5])

输出: array([0,0,3,2,1])

#OneHotEncoder 用于将表示分类的数据扩维:

from sklearn.preprocessing import OneHotEncoder

ohe = OneHotEncoder()

ohe.fit([[1],[2],[3],[4]])

ohe.transform([2],[3],[1],[4]).toarray()

输出:[ [0,1,0,0] , [0,0,1,0] , [1,0,0,0] ,[0,0,0,1] ]

参考四、

利用keras中的keras.utils.to_categorical方法

to_categorical(y, num_classes=None, dtype='float32')

将整型标签转为onehot。y为int数组,num_classes为标签类别总数,大于max(y)(标签从0开始的)。

点滴:python数据集的文本标签转换成数值相关推荐

  1. 如何利用python将NWPU VHR-10目标检测遥感数据集的格式转换成VOC目标检测数据集的格式

    VOC目标检测数据集的格式 其中图片存放在JPEGImages文件夹中,标注是xml文件,存储在Annotations文件中 关于train集和val集的txt划分存放在ImageSets文件夹下面的 ...

  2. Python:UTF-8编码转换成GBK编码

    2019独角兽企业重金招聘Python工程师标准>>> #!/usr/bin/env python # -*- coding:utf-8 -*- #UTF-8转换成GBK编码 #te ...

  3. win下海康工业相机使用python读取视频并转换成cv格式

    硬件设备:海康威视工业相机CA013-A0UC USB3 环境:win10,python3.7,海康MVS 海康工业相机环境配置(MVS) 配置好环境后可以运行一下MVS和MVS\Developmen ...

  4. python 人像素描_基于python实现把图片转换成素描

    这篇文章主要介绍了基于python实现把图片转换成素描,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下 导语: 你是否还在为当时年少时没有选择自己的梦 ...

  5. vba文字型的值转换成数值类型

    今天在做表的时候,发现数组中提取出来的是文字类型,需要转换成数值类型,网上搜索到了字符转换的方法,超级实用,记录下来. 如果用mid函数提取的字符范围增加,可参照VBA中的帮助"类型转换函数 ...

  6. SQL语句 字段类型转换—文本型转换成数值型

    以上三种方法在转换类型的时候都要格外注意被转换类型的值,因为可能会出现各种强制转换失败的问题,比如小数位数/格式不匹配造成的报错. –将文本型转换为数值型 SELECT CONVERT(int,献血量 ...

  7. excel中的文本转换成数值

    excel中的文本转换成数值 B1 = A1*1 都乘上一个1就好了

  8. python画素描画_基于python实现把图片转换成素描

    这篇文章主要介绍了基于python实现把图片转换成素描,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下 导语: 你是否还在为当时年少时没有选择自己的梦 ...

  9. 使用python将多张图片转换成pdf

    有朋友在问如何通过Python将多张图片转换成pdf,刚好之前写了一个小功能,分享给大家. 不多说,直接上代码: #!/usr/local/python3.6.5 #cd /usr/local/pyt ...

最新文章

  1. hadoop错误之ClassNotFoundException
  2. C语言的集成开发环境
  3. 用深度学习就不怕买到山寨奢侈品?LeCun投了这样一家公司
  4. 这家卡车自动驾驶公司图谋借壳上市,Waymo和Cruise的故事讲不下去了?
  5. springCloud--1
  6. python【力扣LeetCode算法题库】225-用队列实现栈
  7. 初识java-循环结构(二):6
  8. 2022年全球及中国智慧消防栓行业与十四五投资建议与竞争策略研究报告
  9. php中的$_server,细说PHP中的$_SERVER
  10. 为什么你总是申请不到大额贷款?
  11. leetcode239. 滑动窗口最大值
  12. sqlmapapi的基本使用和源码阅读
  13. 彭博社推出“机器学习基础”课程
  14. Elasticsearch教程-从入门到精通-ES索引迁移
  15. java数组为什么可以迭代吗_另一个“只能迭代数组或java.lang.Iterable实例”的问题...
  16. centos7 install virt-sysprep
  17. 2018前端开发面试备忘录(1年以上经验初中级别前端开发)-面试篇
  18. android 三方_面试官送你一份Android热门三方库源码面试宝典及学习笔记
  19. qt实现无边框窗体的拉伸和拖动(附原理)
  20. Objective-C的算术表达式 .

热门文章

  1. 微信小程序调用指纹验证
  2. vi 查看最顶部_最详细的 Vi 编辑器使用指南(翻译)
  3. Linux下常用的编辑文件与保存命令
  4. 后缀是lnk是什么文件_后缀lnk是什么文件格式(lnk文件怎么恢复word)
  5. 阿里云ACP ACE认证考试重要事项
  6. 【天光学术】财务会计论文:家电连锁零售企业财务分析方法与注意问题(节选)
  7. 深度学习篇之数据集划分方法-附代码python详细注释
  8. 幻数浅析(Magic Number)
  9. 预处理丨去趋势(Matlab和C++)
  10. 一文搞懂Spring,堪称Spring源码终结者