解决ValueError: y contains previously unseen labels: '103125'

引发原因:有些标签训练集不存在,但却在测试集出现了,而且我们LabelEncoder使用的拟合fit是训练集的数据

解决方式:把原数据集里面没有但是在新数据集遇到的新值放到一个类里面,再将类回传给LabelEncoder. 没有在训练集中出现的label,均视为"unknown"

报错代码块:

更改图中红色框内部分:

def transform_inputs(df, real_scalers, categorical_scalers, real_columns, categorical_columns):"""特征处理transform部分"""out = df.copy()out[real_columns] = real_scalers.transform(df[real_columns].values)for col in categorical_columns:string_df = df[col].apply(str)# error处理string_df = string_df.map(lambda s:'<unknown>' if s not in categorical_scalers[col].classes_ else s)categorical_scalers[col].classes_ = np.append(categorical_scalers[col].classes_, '<unknown>')out[col] = categorical_scalers[col].transform(string_df)return out

错误解决

ValueError: y contains previously unseen labels: ‘103125‘相关推荐

  1. sklearn.LabelEncoder解决未见过值问题(eg.“y contains previously unseen labels: nan“)

    主要思路:把原数据集(比如train data set)里面没有但是在新数据集(比如test data set)遇到的新值放到一个类里面,再将类回传给LabelEncoder.

  2. SVM ValueError: y should be a 1d array, got an array of shape (1, 250) instead. Found input variable

    阅读前请看一下:我是一个热衷于记录的人,每次写博客会反复研读,尽量不断提升博客质量.文章设置为仅粉丝可见,是因为写博客确实花了不少精力.希望互相进步谢谢!! 文章目录 阅读前请看一下:我是一个热衷于记 ...

  3. Python之sklearn:LabelEncoder函数简介(编码与编码还原)、使用方法、具体案例之详细攻略

    Python之sklearn:LabelEncoder函数简介(编码与编码还原).使用方法.具体案例之详细攻略 目录 LabelEncoder函数的简介(编码与编码还原) Methods LabelE ...

  4. ValueError: The least populated class in y has only 1 member, which is too few. The minimum number o

    在切分数据集时提示:ValueError: The least populated class in y has only 1 member, which is too few. The minimu ...

  5. 特征提取,转换和选择

    特征提取,转换和选择 Extracting, transforming and selecting features This section covers algorithms for workin ...

  6. 误差模型:过拟合,交叉验证,偏差-方差权衡

    from: http://www.voidcn.com/blog/Mark_LQ/article/p-5983585.html Introduction In this post you will g ...

  7. 遭遇棘手 交接_Librosa的城市声音分类-棘手的交叉验证

    遭遇棘手 交接 大纲 (Outline) The goal of this post is two-fold: 这篇文章的目标有两个: I'll show an example of implemen ...

  8. 深度学习模型建立过程_所有深度学习都是统计模型的建立

    深度学习模型建立过程 Deep learning is often used to make predictions for data driven analysis. But what are th ...

  9. fastai 文本分类_使用Fastai v2和多标签文本分类器检查有毒评论

    fastai 文本分类 The internet has become a basic necessity in recent times and a lot of things which happ ...

  10. 元学习 迁移学习_元学习就是您所需要的

    元学习 迁移学习 Update: This post is part of a blog series on Meta-Learning that I'm working on. Check out ...

最新文章

  1. Base62x比Base64的编码速度更快吗?
  2. keepalived介绍和配置
  3. 再谈RPC--长长的手,抓住了离去的你
  4. python 如何把小数变成百分数格式
  5. 运动会成绩管理系统python_基于Eclipse+Mysql+Tomcat+MVC开发得大学运动会管理系统
  6. cesium获取模型实时坐标_Cesium 顶点着色器中解算模型坐标
  7. 设计模式是什么鬼(状态)
  8. linux文件句柄数
  9. 谈谈流计算中的『Exactly Once』特性
  10. RESTful 风格 API 接口文档模板
  11. 《FLUENT 14.0超级学习手册》—— 导读
  12. Nero Video 2019中文破解版
  13. [渝粤教育] 西北农林科技大学 土壤学 参考 资料
  14. 软件测试学习路线全面攻略,掌握这些技术轻松15K
  15. Unix与Linux、Minx、Minix
  16. Excel如何快速合并相同单元格
  17. 你的小程序|公众号 还未设置管理员信息,无法被绑定
  18. 程序猿怎么利用技术挣钱?——python量化实践
  19. Obsidian 插件(一):DataView 的使用
  20. 我是如何写出一本畅销技术书的?持续更新

热门文章

  1. 蓄水池采样算法的python实现_蓄水池采样算法-Reservoir Sampling
  2. 订单超时未支付自动关闭实现方案
  3. Android开发英语单词积累
  4. 推荐系统中的常用算法——基于Graph Embedding的GES和EGES
  5. 激活MyEclipse 无法运行cracker2018.jar
  6. python自动进直播_Python实现自动录制虎牙直播
  7. 海康威视实习生面试总结
  8. 华为社招机试卷经验总结
  9. kubectl rollout restart 命令“unkonw command“
  10. liinux下安装jdk