lgb(lightgbm)处理类别特征遇到的问题(泰坦尼克):
1.lgb(lightgbm)处理类别特征遇到的问题:
ValueError: DataFrame.dtypes for data must be int, float or bool. Did
not expect the data types in the following fields: Sex, Embarked
加上这些代码,完美解决,记得点赞
from sklearn import preprocessing
encoder = preprocessing.LabelEncoder()
encoder.fit(list(X["Sex"].values))
X["Sex"]=encoder.transform(list(X["Sex"].values))
encoder.fit(list(X["Embarked"].values))
X["Embarked"]=encoder.transform(list(X["Embarked"].values))
2.注意函数预测时得到的不是0和1,需要自己划分区间。‘
y_gbm_pred[y_gbm_pred > .5] = 1
y_gbm_pred[y_gbm_pred <=.5] = 0
3,注意提取(pd.read_csv)时,会把所有列都提取,所以需要提取特定列。
这3个小问题卡的我这个新手一愣一愣的。
lgb(lightgbm)处理类别特征遇到的问题(泰坦尼克):相关推荐
- lightgbm处理类别特征
lightGBM的categorical_feature(类别特征)使用 http://www.luyixian.cn/news_show_253681.aspx lightGBM比XGBoost的1 ...
- Lightgbm如何处理类别特征?
本篇文章主要参考柯国霖大神在知乎上的回答,以及自己阅读LGBM的部分源码整理而来. 1.one-hot编码弊端 one-hot编码是处理类别特征的一个通用方法,然而在树模型中,这可能并不一定是一个好的 ...
- 利用神经网络的embedding层处理类别特征
类别特征在现实里十分常见,处理的方法也很多,最常见的思路是转为one-hot编码,当然这种处理方式比较粗暴,在许多算法里效果也不是很好.还有的处理方式寻找类别特征的最优切分,这个需要特定工具的支持,如 ...
- AI基础:特征工程-类别特征
0.导语 特征工程到底是什么呢?顾名思义,其本质是一项工程活动,目的是最大限度地从原始数据中提取特征以供算法和模型使用. 此之前,我已经写了以下几篇AI基础的快速入门,本篇文章讲解特征工程基础第一部分 ...
- [深度学习]CTR模型如何加入稠密连续型|多值类别特征
一 稠密连续类型特征的处理 在点击率预估问题中,可以尝试的几种方法 1.归一化后直接拼接到embedding向量侧dnn部分,不参与fm部分交叉 归一化的方式可以包括:直接对原始特征做归一化:通过bn ...
- 多值类别特征加入CTR预估模型的方法
[摘要] 本文用图示的方法梳理和介绍了多值类别特征加入到CTR预估模型的一般方法,通俗易懂. 我们都知道一般单值类别特征加入到CTR预估模型的方法是先对单值类别特征进行one-hot,然后和embed ...
- KDD2021 | 推荐系统中利用深度哈希方法学习类别特征表示
本文分享一篇谷歌团队发表在KDD'21的推荐系统文章:不使用嵌入表的方式获得类别特征的表征用于推荐系统[1]. 本文结构组织如下: 背景 已有的类别特征嵌入方法 One-hot Full Embedd ...
- 机器学习基础(三十七) —— 处理类别特征
当类别特征仍保持原始形式时,其取值来自所有可能取值构成的集合而不是一个数字,故不能作为输入. 当各个取值之间是没有顺序关系的并列关系,这样的类别特征称为 名义(nominal)变量.相反,那些存在顺序 ...
- 05如何处理类别特征?
Categorical Variables: Counting Eggs in theAge of Robotic Chickens 定义: 类别变量:顾名思义代表类别或标签. 比如: 世界上的主要城 ...
最新文章
- 出租房的网络环境研究
- python 输出在固定位置_python多进程/线程抢占stdoutput总是在固定位置截断上个输出?...
- [渝粤教育] 西南科技大学 数据库应用 在线考试复习资料
- java值类型和引用类型 == 比较,Java中值类型和引用类型的比较与问题解决
- 汇编常用命令、指令一览
- 美国计算机协会ACM子刊中国特辑:中国的人工智能初创企业
- linux软件中心替代,Ubuntu 16.04 LTS 将替换 Ubuntu 软件中心
- 中兴通讯遭大股东减持逾两千万股 盘中跌逾6%
- oracle查询数据库的函数,Oracle:树查询及有关函数
- 第二次项目冲刺(Beta阶段)--第五天
- 使用T-SQL语句创建数据库
- 基于php旅游网站的设计与实现
- mongodb的基本使用
- 计算机技术专硕学哪些课程,计算机专业考研需要考哪些科目
- When I’m old and dying
- uni-app 蓝牙通信
- matlab保存nii_Matlab实现NIfTI(ANALYZE)核磁共振图像读写
- linux 中断子系统
- linux下apache 的安装,php安装过程
- 利用Termux在手机上运行Linux系统