工作中常使用的数据转换有很多,比如SimpleImputer类可用于替换缺少的值,MinMaxScaler类可用于缩放数值,而OneHotEncoder可用于编码分类变量。

ColumnTransformer()在Python的机器学习库scikit-learn中,可以选择地进行数据转换。例如,它允许将特定的转换或转换序列仅应用于数字列,而将单独的转换序列仅应用于类别列。

要使用ColumnTransformer,必须指定一个转换器列表。每个转换器是一个三元素元组,用于定义转换器的名称,要应用的转换以及要应用于其的列索引,例如:(名称,对象,列)

1. ColumnTransformerOneHotEncoder应用于列0和1。

transformer = ColumnTransformer(transformers=[('cat', OneHotEncoder(), [0, 1])])

2. 对数字列0和1应用具有中值插补的SimpleImputer,对分类列2和3应用最频繁插补的SimpleImputer

t = [('num', SimpleImputer(strategy='median'), [0, 1]), ('cat', SimpleImputer(strategy='most_frequent'), [2, 3])]
transformer = ColumnTransformer(transformers=t)

3. 如果第0列和第1列是数字列,而第2列和第3列是分类列,而我们只想转换分类数据并不改变数字列,则可以按以下方式定义ColumnTransformer

transformer = ColumnTransformer(transformers=[('cat', OneHotEncoder(), [2, 3])], remainder='passthrough')

ColumnTransformer()函数相关推荐

  1. 不平衡数据集分类实战:成人收入数据集分类模型训练和评估

    许多二分类任务并不是每个类别都有相同数量的数据,存在着数据分布不平衡的情况. 一个常用的例子是成人收入数据集,它涉及到社交关系.教育水平等个人数据,以此来预测成人的收入水平,判断其是否拥有5万美元/年 ...

  2. Spring-data-jpa中用@ColumnTransformer注解加密,中文乱码问题(数据库正常,在java代码和页面中乱码)

    jpa中用@ColumnTransformer注解将name字段加密,可是在数据库中解密返回的是正常值,而经过java解析后,在前端页面中还是出现了字符乱码的情况 @Column(name = &qu ...

  3. postgresql安装所需函数插件(比如加密函数hamc()函数使用)

    1.postgresql 执行命令,添加加密函数支持 create extension pgcrypto; 2.hmac函数的使用 用户密码的使用,jpa使用用户实体类密码添加注解,直接使用jpa进行 ...

  4. 数据库中自定义排序规则,Mysql中自定义字段排序规则,Oracle中自定义字段排序规则,decode函数的用法,field函数的用法

    数据库中自定义排序 场景:有一张banner表,表中有一个status字段,有0, 1, 2三个状态位,我想要 1,0,2的自定义排序(这里是重点),然后再进行之上对sequence字段进行二次排序( ...

  5. Mysql函数group_concat、find_in_set 多值分隔字符字段进行数据库字段值翻译

    Mysql函数group_concat.find_in_set进行数据库字段值翻译 场景 配方表:记录包含的原料 sources表示原料,字段值之间用逗号分隔 原料表:对应原料id和原料名称 现需要查 ...

  6. C++ 笔记(34)— C++ exit 函数

    当遇到 main 函数中的 return 语句时,C++ 程序将停止执行.但其他函数结束时,程序并不会停止.程序的控制将返回到函数调用之后的位置.然而,有时候会出现一些非常少见的情况,使得程序有必要在 ...

  7. C++ 笔记(30)— 友元函数与友元类

    我们知道类的私有成员只能在类的成员函数内部访问,如果想在别处访问对象的私有成员,只能通过类提供的接口(成员函数)间接地进行.这固然能够带来数据隐藏的好处,利于将来程序的扩充,但也会增加程序书写的麻烦. ...

  8. 浅显易懂 Makefile 入门 (07)— 其它函数(foreach 、if、call、origin )

    1. foreach 函数 foreach 函数定义如下: $(foreach <var>,<list>,<text>) 函数的功能是:把参数 <list&g ...

  9. 浅显易懂 Makefile 入门 (06)— 文件名操作函数(dir、notdir、suffix、basename、addsuffix、addperfix、join、wildcard)

    编写 Makefile 的时候,很多情况下需要对文件名进行操作.例如获取文件的路径,去除文件的路径,取出文件前缀或后缀等等. 注意:下面的每个函数的参数字符串都会被当作或是一个系列的文件名来看待. 1 ...

最新文章

  1. 今天是2013年06月21日,博客之路开始了!
  2. request获取int类型的值_获取通话记录或通讯录的数量为负值
  3. 小学生python-如何看待小学生开始学Python?
  4. java 二维数组作为参数传递_java JNI 二维数组作为方法参数传递给本地
  5. 请求因 HTTP 状态 401 失败:Unauthorized。
  6. 使用Adaptive cards来构建Teams app的界面
  7. 四则运算2扩展---c++
  8. Docker-compose编排微服务顺序启动解决方案
  9. 洛谷 [P2756] 飞行员配对方案问题 网络流实现
  10. 一个奇怪的DNS服务器故障
  11. HDF5: 读写速度与文件的大小
  12. opencv-python:17_图像经典边缘检测算子(边缘检测、图像梯度、Roberts算子、Prewitt算子、Sobel 算子、Laplacian 算子、Canny算子、算子优缺点对比)
  13. 文件夹有个蓝色箭头_带有双蓝色箭头的Windows文件夹图标是什么意思?
  14. 视频教程-高效办公软件之word2010入门到精通全套视频-Office/WPS
  15. intel linux核显性能,Intel UHD Graphics 630 核显性能解析
  16. java socket通信 客户端_JavaのSocket编程之简单客户端与服务器端通信
  17. GoLang 单元测试打桩和 mock
  18. mysql的explain关键字ken_len列
  19. 2019世界智能网联汽车大会10月召开
  20. Lawliet|编程学习基础

热门文章

  1. 贴吧顶帖工作室(贴吧怎么顶帖)
  2. xlsxwriter进度条php,PHP导出Excel数据导出,前端进度条实现方式
  3. a pubhub service
  4. 零基础搭建获利的外卖cps平台公众号
  5. 微信小程序 app.wxss css 不生效
  6. 第五章 课后习题(P139-140)
  7. 【51CTO学院】双11抽奖规则
  8. 推荐一款过滤百度广告的神器
  9. 互联网金融概念股龙头有哪些
  10. 闲扯资管创新1:短债基金和摊余成本法定开债基