在有些数据集中,有些数据变量用字符串表示,但为了方便处理,往往想转换为好处理的格式,这时候不一定要用one hot进行编码,也可以直接转成整数:

test_df["xx"] = pd.factorize(test_df["xx"])[0].astype(int)

但是这样映射的数字是从0开始的,如果有初始要求,可以对映射结果加上某个值,例如,把从0开始变为从15开始:

test_df["xx"] = test_df["xx"].add(15)

效果gift_cards["user_id"] = pd.factorize(gift_cards["user_id"])[0].astype(int)

           user_id         item_id  ratings        time
0       B001GXRQW0   APV13CM0919JD      1.0  1229644800
1       B001GXRQW0  A3G8U1G1V082SN      5.0  1229472000
2       B001GXRQW0   A11T2Q0EVTUWP      5.0  1229472000
3       B001GXRQW0   A9YKGBH3SV22C      5.0  1229472000
4       B001GXRQW0  A34WZIHVF3OKOL      1.0  1229472000
...            ...             ...      ...         ...
147189  B01H5PPJT4  A2K9WVQW9TLWNK      5.0  1536969600
147190  B01H5PPJT4  A149ALSR6TPGF7      4.0  1536278400
147191  B01H5PPJT4  A2Q066NZCQSCOR      5.0  1535500800
147192  B01H5PPJT4  A1KJLWCW7XBS8I      5.0  1534550400
147193  B01H5PPJT4   ANABUB0FRZXRM      5.0  1534204800
        user_id         item_id  ratings        time
0             0   APV13CM0919JD      1.0  1229644800
1             0  A3G8U1G1V082SN      5.0  1229472000
2             0   A11T2Q0EVTUWP      5.0  1229472000
3             0   A9YKGBH3SV22C      5.0  1229472000
4             0  A34WZIHVF3OKOL      1.0  1229472000
...         ...             ...      ...         ...
147189      858  A2K9WVQW9TLWNK      5.0  1536969600
147190      858  A149ALSR6TPGF7      4.0  1536278400
147191      858  A2Q066NZCQSCOR      5.0  1535500800
147192      858  A1KJLWCW7XBS8I      5.0  1534550400
147193      858   ANABUB0FRZXRM      5.0  1534204800

很成功

pandas 将字符串映射为数字的方法相关推荐

  1. python判断字符串是纯数字_python判断字符串是否纯数字的方法

    本文实例讲述了python判断字符串是否纯数字的方法.分享给大家供大家参考.具体如下: 判断的代码如下,通过异常判断不能区分前面带正负号的区别,正则表达式可以根据自己需要比较灵活的写,通过isdigi ...

  2. java中判断字符串是否为数字的方法 StringUtil包函数

    java中判断字符串是否为数字的方法: 1.用JAVA自带的函数 public static boolean isNumeric(String str){   for (int i = 0; i &l ...

  3. pandas dataframe 字符映射为数字

    在机器学习中对于有序的类别型变量可以不采用onehot编码,直接使用有序数字代替即可,这个目的可以在pandas中使用map方法实现. import pandas as pd 创建数据框 raw_da ...

  4. isdigit函数python_Python判断字符串是否为数字的方法isdecimal 、isdigit、isnumeric及坑...

    Python判断字符串是否为"数字",这个"数字"的说法相对比较模糊.主要的区别在哪里呢,来段代码输出看一下. 从Unicode官网查询到当前的Unicode版 ...

  5. 字符串转换成数字的方法【C#】

    在C#中,经常需要将字符串转换成数字,简单总结三种方法: 一.Convert:将一个基本数据类型转换成另一个基本数据类型. 比如,将用户输入的数学成绩进行转换: int math = Convert. ...

  6. php将字符串转成数字,实例分析PHP将字符串转换成数字的方法

    下面给大家介绍PHP将字符串转换成数字的四种方法. 方法1: 使用number_format()函数.number_format()函数用于将字符串转换为数字.它会在成功时返回格式化的数字,否则会在失 ...

  7. C++读取字符串中的数字的方法

    代码实例: #include <iostream> #include <sstream> #include <fstream> using namespace st ...

  8. 在Java中用正则表达式判断一个字符串是否是数字的方法

    package chengyujia;import java.util.regex.Pattern;public class NumberUtil {/*** 判断一个字符串是否是数字.* * @pa ...

  9. js 字符串 转换成 数字 的方法

    var num1 = parseFloat(prompt('请输入第一个数',''));var num2 = parseFloat(prompt('请输入第二个数',''));alert(num1+' ...

最新文章

  1. 【EventBus】发布-订阅模式 ( Android 中使用 发布-订阅模式 进行通信 )
  2. 【NOIP】提高组2012 同余方程
  3. 文献学习(part10)--元自步学习
  4. 深度学习(17)TensorFlow高阶操作六: 高阶OP
  5. layer绑定回车事件(转)
  6. 护卫神怎么增加php版本_护卫神php套件 php版本升级方法(php5.5.24)
  7. python-函数与变量的定义-标识符的命名规范
  8. linux comsol命令,如何从命令行运行 COMSOL Multiphysics®
  9. StdC--12 结构体
  10. cad立体图怎么旋转看图_教大家CAD迷你看图如何旋转图纸
  11. ad中按钮开关的符号_电路仿真软件CADe_SIMU的电气元件符号翻译和下载地址
  12. elasticsearch7.5.0 集群搭建
  13. 举个栗子!Tableau 技巧(105):用 四象限图 对数据进行分类分析
  14. 水果食用大全 -- 果品食疗 - 雪梨
  15. java定义一个生日类_java定义一个学生类,学生类的数据成员有姓名,学号,出生日期,专业,提供两个以上的...
  16. 笔记:基本的世代交叠模型
  17. 阿里云服务器被攻击10g怎么进黑洞了?
  18. LinuxProbe学习第一天
  19. 2007年9月1日御夫座流星雨
  20. 苹果新规,微信面临下架?一文看懂苹果与腾讯“相亲相爱相杀”

热门文章

  1. 《录取通知》 观后感
  2. 运行ISTA测试代码所遇问题
  3. 图解 赫夫曼编码?(赫夫曼大叔开讲啦!!!)
  4. SpringCloud Alibaba Nacos服务注册和配置中心-微服务(二十六)
  5. maya python 开根号,基于python不同开根号的速度对比分析
  6. 嵌套For循环性能优化分析
  7. 集群、分布式、负载均衡
  8. VMware之最简单的联网方式----Linux系统
  9. Ricoh Theta X 评测
  10. matlab运行时,窗口化