1.lgb(lightgbm)处理类别特征遇到的问题:

ValueError: DataFrame.dtypes for data must be int, float or bool. Did
not expect the data types in the following fields: Sex, Embarked

加上这些代码,完美解决,记得点赞

from sklearn import preprocessing
encoder = preprocessing.LabelEncoder()
encoder.fit(list(X["Sex"].values))
X["Sex"]=encoder.transform(list(X["Sex"].values))
encoder.fit(list(X["Embarked"].values))
X["Embarked"]=encoder.transform(list(X["Embarked"].values))

2.注意函数预测时得到的不是0和1,需要自己划分区间。‘

y_gbm_pred[y_gbm_pred > .5] = 1
y_gbm_pred[y_gbm_pred <=.5] = 0


3,注意提取(pd.read_csv)时,会把所有列都提取,所以需要提取特定列。

这3个小问题卡的我这个新手一愣一愣的。

lgb(lightgbm)处理类别特征遇到的问题(泰坦尼克):相关推荐

  1. lightgbm处理类别特征

    lightGBM的categorical_feature(类别特征)使用 http://www.luyixian.cn/news_show_253681.aspx lightGBM比XGBoost的1 ...

  2. Lightgbm如何处理类别特征?

    本篇文章主要参考柯国霖大神在知乎上的回答,以及自己阅读LGBM的部分源码整理而来. 1.one-hot编码弊端 one-hot编码是处理类别特征的一个通用方法,然而在树模型中,这可能并不一定是一个好的 ...

  3. 利用神经网络的embedding层处理类别特征

    类别特征在现实里十分常见,处理的方法也很多,最常见的思路是转为one-hot编码,当然这种处理方式比较粗暴,在许多算法里效果也不是很好.还有的处理方式寻找类别特征的最优切分,这个需要特定工具的支持,如 ...

  4. AI基础:特征工程-类别特征

    0.导语 特征工程到底是什么呢?顾名思义,其本质是一项工程活动,目的是最大限度地从原始数据中提取特征以供算法和模型使用. 此之前,我已经写了以下几篇AI基础的快速入门,本篇文章讲解特征工程基础第一部分 ...

  5. [深度学习]CTR模型如何加入稠密连续型|多值类别特征

    一 稠密连续类型特征的处理 在点击率预估问题中,可以尝试的几种方法 1.归一化后直接拼接到embedding向量侧dnn部分,不参与fm部分交叉 归一化的方式可以包括:直接对原始特征做归一化:通过bn ...

  6. 多值类别特征加入CTR预估模型的方法

    [摘要] 本文用图示的方法梳理和介绍了多值类别特征加入到CTR预估模型的一般方法,通俗易懂. 我们都知道一般单值类别特征加入到CTR预估模型的方法是先对单值类别特征进行one-hot,然后和embed ...

  7. KDD2021 | 推荐系统中利用深度哈希方法学习类别特征表示

    本文分享一篇谷歌团队发表在KDD'21的推荐系统文章:不使用嵌入表的方式获得类别特征的表征用于推荐系统[1]. 本文结构组织如下: 背景 已有的类别特征嵌入方法 One-hot Full Embedd ...

  8. 机器学习基础(三十七) —— 处理类别特征

    当类别特征仍保持原始形式时,其取值来自所有可能取值构成的集合而不是一个数字,故不能作为输入. 当各个取值之间是没有顺序关系的并列关系,这样的类别特征称为 名义(nominal)变量.相反,那些存在顺序 ...

  9. 05如何处理类别特征?

    Categorical Variables: Counting Eggs in theAge of Robotic Chickens 定义: 类别变量:顾名思义代表类别或标签. 比如: 世界上的主要城 ...

最新文章

  1. 出租房的网络环境研究
  2. python 输出在固定位置_python多进程/线程抢占stdoutput总是在固定位置截断上个输出?...
  3. [渝粤教育] 西南科技大学 数据库应用 在线考试复习资料
  4. java值类型和引用类型 == 比较,Java中值类型和引用类型的比较与问题解决
  5. 汇编常用命令、指令一览
  6. 美国计算机协会ACM子刊中国特辑:中国的人工智能初创企业
  7. linux软件中心替代,Ubuntu 16.04 LTS 将替换 Ubuntu 软件中心
  8. 中兴通讯遭大股东减持逾两千万股 盘中跌逾6%
  9. oracle查询数据库的函数,Oracle:树查询及有关函数
  10. 第二次项目冲刺(Beta阶段)--第五天
  11. 使用T-SQL语句创建数据库
  12. 基于php旅游网站的设计与实现
  13. mongodb的基本使用
  14. 计算机技术专硕学哪些课程,计算机专业考研需要考哪些科目
  15. When I’m old and dying
  16. uni-app 蓝牙通信
  17. matlab保存nii_Matlab实现NIfTI(ANALYZE)核磁共振图像读写
  18. linux 中断子系统
  19. linux下apache 的安装,php安装过程
  20. 利用Termux在手机上运行Linux系统

热门文章

  1. 建立自己的3389肉鸡(基础级)
  2. 自然语言处理之Doc2Vec的原理和使用
  3. 计算机用户组改密码,怎么修改windows2012用户密码
  4. python多核并行计算_Python 多核并行计算
  5. 3.4 Linux系统日志的清除
  6. Anaconda 添加镜像源
  7. 基于ARM核的Intel XScale嵌入式系统
  8. 【移动通信】4G载波聚合
  9. 漏洞挖掘之fuzz测试
  10. css .clearfix,css之clearfix的用法深入理解(必看篇)