今日锦囊

特征无量纲化的常见操作方法

第一招,从简单的特征量纲处理开始,这里介绍了3种无量纲化操作的方法,同时也附上相关的包以及调用方法,欢迎补充!

无量纲化:即nondimensionalize 或者dimensionless,是指通过一个合适的变量替代,将一个涉及物理量的方程的部分或全部的单位移除,以求简化实验或者计算的目的。——百度百科

进行进一步解释,比如有两个字段,一个是车行走的公里数,另一个是人跑步的距离,他们之间的单位其实差异还是挺大的,其实两者之间无法进行比较的,但是我们可以进行去量纲,把他们的变量值进行缩放,都统一到某一个区间内,比如0-1,便于不同单位或者量级之间的指标可以进行比较or加权!

下面的是sklearn里的一些无量纲化的常见操作方法。

from sklearn.datasets import load_iris
#导入IRIS数据集
iris = load_iris()#标准化,返回值为标准化后的数据
from sklearn.preprocessing import StandardScaler
StandardScaler().fit_transform(iris.data)#区间缩放,返回值为缩放到[0, 1]区间的数据
from sklearn.preprocessing import MinMaxScaler
MinMaxScaler().fit_transform(iris.data)#归一化,返回值为归一化后的数据
from sklearn.preprocessing import Normalizer
Normalizer().fit_transform(iris.data)

通过上述的方法调用,可以达到我们进行去量纲的目的,你学会了吗?

原创不易,如果觉得这种学习方式有用,希望可以帮忙随手转发or点下“在看”,这是对我的极大鼓励!阿里嘎多!????

特征锦囊:特征无量纲化的常见操作方法相关推荐

  1. linux中python如何调用matlab的数据_特征锦囊:如何在Python中处理不平衡数据

    今日锦囊 特征锦囊:如何在Python中处理不平衡数据 ? Index 1.到底什么是不平衡数据 2.处理不平衡数据的理论方法 3.Python里有什么包可以处理不平衡样本 4.Python中具体如何 ...

  2. 特征锦囊:如何根据变量相关性画出热力图?

    今日锦囊 特征锦囊:如何根据变量相关性画出热力图? 上次的锦囊有提及到如何使用sklearn来实现多项式的扩展来衍生更多的变量,但是我们也知道其实这样子出来的变量之间的相关性是很强的,我们怎么可以可视 ...

  3. 特征锦囊:怎么找出数据集中有数据倾斜的特征?

    今日锦囊 特征锦囊:怎么找出数据集中有数据倾斜的特征? 今天我们用的是一个新的数据集,也是在kaggle上的一个比赛,大家可以先去下载一下: 下载地址:https://www.kaggle.com/c ...

  4. 特征锦囊:怎么尽可能地修正数据倾斜的特征?

    今日锦囊 特征锦囊:怎么尽可能地修正数据倾斜的特征? 上一个锦囊,分享了给大家通过skew的方法来找到数据集中有数据倾斜的特征(特征锦囊:怎么找出数据集中有数据倾斜的特征?),那么怎么去修正它呢?正是 ...

  5. 特征缩放+无量纲化:最小最大缩放 - Python代码实现

    特征缩放+无量纲化:最小最大缩放 - Python代码实现 在机器学习的特征工程中,对于数据进行特征缩放和无量纲化是非常重要的步骤.其中,最小最大缩放(MinMaxScaler)是一种经典的无量纲化方 ...

  6. 机器学习特征工程之特征缩放+无量纲化:数据标准化(StandardScaler)

    机器学习特征工程之特征缩放+无量纲化:数据标准化(StandardScaler) 在Andrew Ng的机器学习课程里面,讲到使用梯度下降的时候应当进行特征缩放(Feature Scaling).进行 ...

  7. 机器学习特征工程之特征缩放+无量纲化:最小最大缩放(MinMaxScaler)

    机器学习特征工程之特征缩放+无量纲化:最小最大缩放(MinMaxScaler) 在Andrew Ng的机器学习课程里面,讲到使用梯度下降的时候应当进行特征缩放(Feature Scaling).进行缩 ...

  8. 机器学习特征工程之特征缩放+无量纲化:最大绝对值缩放(MaxAbsScaler)

    机器学习特征工程之特征缩放+无量纲化:最大绝对值缩放(MaxAbsScaler) 在Andrew Ng的机器学习课程里面,讲到使用梯度下降的时候应当进行特征缩放(Feature Scaling).进行 ...

  9. 二值化_处理连续型特征:二值化与分段

    preprocessing.Binarizer 根据阈值将数据二值化(将特征值设置为0或1),用于处理连续型变量.大于阈值的值映射为1,而小于或等于阈值的值映射为0.默认阈值为0时,特征中所有的正值都 ...

  10. 四、数据预处理——处理连续型特征:二值化与分段

    四.数据预处理--处理连续型特征:二值化与分段 点击标题即可获取文章相关的源代码文件哟! - sklearn.preprocessing.Binarizer 根据阈值将数据二值化(将特征值设置为0或1 ...

最新文章

  1. linux驱动:音频驱动(五)ASoc之codec驱动
  2. 收到2013年51cto限量版精美台历
  3. JavaNIO - AbstractInterruptibleChannel
  4. python调用有道词典_菜鸟上手Python最有野心的库Asyncio
  5. 088_html5表单属性
  6. html登录界面_php实现登录功能
  7. 操作系统(九)进程控制
  8. 辅助类KeyNode
  9. html5中如何自动跳转页面,实现HTML5上滑跳转页面的两种方法
  10. Git flow(使用工具自动git flow+解决合并冲突)
  11. python 元组的一点问题
  12. sapply lapply_R编程中的apply(),sapply(),lapply()和tapply()函数
  13. 长连接与短连接的区别
  14. mysql中date类型_MySql的日期类型datetime和timestamp
  15. 帝国cms !--list.var1--,!--list.var2--的终极用法
  16. 软件测试之因果图法(P24——P26)
  17. 什么是java socket
  18. 好奇,什么水平才能任教清华计算机系?
  19. Unity TileMap 存档 保存地图
  20. windows 查看wifi密码命令

热门文章

  1. 今日学习在线编程题:可怜的小码哥
  2. cortex A73/A53/A57
  3. Spring框架学习笔记05:SpringAop
  4. 六万字带你一次性速通python爬虫基础
  5. 阿里云服务器ECS(VPS)介绍及使用视频教程和优惠活动
  6. Claude Shannon 的“创新性思维”演讲:一个天才揭示如何变得具有创新性
  7. 一张纸的厚度大约是0.08mm,对折多少次之后能达到珠穆朗玛峰的高度(8848.13米)
  8. 代码读智识  笔墨知人心
  9. linux桌面图标恢复,修复桌面白图标的教程
  10. 疑似集体出走,支付宝蚂蚁庄园小鸡不见了