ValueError: y contains previously unseen labels: ‘103125‘
解决ValueError: y contains previously unseen labels: '103125'
引发原因:有些标签训练集不存在,但却在测试集出现了,而且我们LabelEncoder使用的拟合fit是训练集的数据
解决方式:把原数据集里面没有但是在新数据集遇到的新值放到一个类里面,再将类回传给LabelEncoder. 没有在训练集中出现的label,均视为"unknown"
报错代码块:
更改图中红色框内部分:
def transform_inputs(df, real_scalers, categorical_scalers, real_columns, categorical_columns):"""特征处理transform部分"""out = df.copy()out[real_columns] = real_scalers.transform(df[real_columns].values)for col in categorical_columns:string_df = df[col].apply(str)# error处理string_df = string_df.map(lambda s:'<unknown>' if s not in categorical_scalers[col].classes_ else s)categorical_scalers[col].classes_ = np.append(categorical_scalers[col].classes_, '<unknown>')out[col] = categorical_scalers[col].transform(string_df)return out
错误解决
ValueError: y contains previously unseen labels: ‘103125‘相关推荐
- sklearn.LabelEncoder解决未见过值问题(eg.“y contains previously unseen labels: nan“)
主要思路:把原数据集(比如train data set)里面没有但是在新数据集(比如test data set)遇到的新值放到一个类里面,再将类回传给LabelEncoder.
- SVM ValueError: y should be a 1d array, got an array of shape (1, 250) instead. Found input variable
阅读前请看一下:我是一个热衷于记录的人,每次写博客会反复研读,尽量不断提升博客质量.文章设置为仅粉丝可见,是因为写博客确实花了不少精力.希望互相进步谢谢!! 文章目录 阅读前请看一下:我是一个热衷于记 ...
- Python之sklearn:LabelEncoder函数简介(编码与编码还原)、使用方法、具体案例之详细攻略
Python之sklearn:LabelEncoder函数简介(编码与编码还原).使用方法.具体案例之详细攻略 目录 LabelEncoder函数的简介(编码与编码还原) Methods LabelE ...
- ValueError: The least populated class in y has only 1 member, which is too few. The minimum number o
在切分数据集时提示:ValueError: The least populated class in y has only 1 member, which is too few. The minimu ...
- 特征提取,转换和选择
特征提取,转换和选择 Extracting, transforming and selecting features This section covers algorithms for workin ...
- 误差模型:过拟合,交叉验证,偏差-方差权衡
from: http://www.voidcn.com/blog/Mark_LQ/article/p-5983585.html Introduction In this post you will g ...
- 遭遇棘手 交接_Librosa的城市声音分类-棘手的交叉验证
遭遇棘手 交接 大纲 (Outline) The goal of this post is two-fold: 这篇文章的目标有两个: I'll show an example of implemen ...
- 深度学习模型建立过程_所有深度学习都是统计模型的建立
深度学习模型建立过程 Deep learning is often used to make predictions for data driven analysis. But what are th ...
- fastai 文本分类_使用Fastai v2和多标签文本分类器检查有毒评论
fastai 文本分类 The internet has become a basic necessity in recent times and a lot of things which happ ...
- 元学习 迁移学习_元学习就是您所需要的
元学习 迁移学习 Update: This post is part of a blog series on Meta-Learning that I'm working on. Check out ...
最新文章
- Base62x比Base64的编码速度更快吗?
- keepalived介绍和配置
- 再谈RPC--长长的手,抓住了离去的你
- python 如何把小数变成百分数格式
- 运动会成绩管理系统python_基于Eclipse+Mysql+Tomcat+MVC开发得大学运动会管理系统
- cesium获取模型实时坐标_Cesium 顶点着色器中解算模型坐标
- 设计模式是什么鬼(状态)
- linux文件句柄数
- 谈谈流计算中的『Exactly Once』特性
- RESTful 风格 API 接口文档模板
- 《FLUENT 14.0超级学习手册》—— 导读
- Nero Video 2019中文破解版
- [渝粤教育] 西北农林科技大学 土壤学 参考 资料
- 软件测试学习路线全面攻略,掌握这些技术轻松15K
- Unix与Linux、Minx、Minix
- Excel如何快速合并相同单元格
- 你的小程序|公众号 还未设置管理员信息,无法被绑定
- 程序猿怎么利用技术挣钱?——python量化实践
- Obsidian 插件(一):DataView 的使用
- 我是如何写出一本畅销技术书的?持续更新
热门文章
- 蓄水池采样算法的python实现_蓄水池采样算法-Reservoir Sampling
- 订单超时未支付自动关闭实现方案
- Android开发英语单词积累
- 推荐系统中的常用算法——基于Graph Embedding的GES和EGES
- 激活MyEclipse 无法运行cracker2018.jar
- python自动进直播_Python实现自动录制虎牙直播
- 海康威视实习生面试总结
- 华为社招机试卷经验总结
- kubectl rollout restart 命令“unkonw command“
- liinux下安装jdk