ML之FE:特征工程处理中常用的数据变换(log取对数变换等)之详细攻略

目录

特征工程处理中常用的数据变换(log取对数变换等)之详细攻略

log取对数变换


特征工程处理中常用的数据变换(log取对数变换等)之详细攻略

log取对数变换

意义:取对数之后不会改变数据的性质和相关关系,但压缩了变量的尺度。让方差恒定,即让波动相对稳定,消除异方差问题。

import numpy as np
import pandas as pdarray_data=np.array([[1,  2,  3,  4,  5],[0.1,0.2,0.3,0.4,0.5])
print(array_data.shape)array_data2log = -np.log(array_data)  # 取对数之后不会改变数据的性质和相关关系,但压缩了变量的尺度。让方差恒定,即让波动相对稳定。消除异方差问题
print(array_data2log)
dis = np.sqrt(array_data2log)
print(dis)

更新……

ML之FE:特征工程处理中常用的数据变换(log取对数变换等)之详细攻略相关推荐

  1. ML之ME/LF:机器学习之风控业务中常用模型监控指标CSI(特征稳定性指标)的简介、使用方法、案例应用之详细攻略

    ML之ME/LF:机器学习之风控业务中常用模型监控指标CSI(特征稳定性指标)的简介.使用方法.案例应用之详细攻略 目录 CSI(特征稳定性指标)的简介 1.如何计算CSI? 2.CSI值的意义 3. ...

  2. ML之SL:监督学习(Supervised Learning)的简介、应用、经典案例之详细攻略

    ML之SL:监督学习(Supervised Learning)的简介.应用.经典案例之详细攻略 目录 监督学习(Supervised Learning)的简介 1.监督学习问题的两大类-分类问题和回归 ...

  3. Algorithm:机械优化设计的数学模型简介、常用优化方法、优化计算工具简介之详细攻略

    Algorithm:机械优化设计的数学模型简介.常用优化方法.优化计算工具简介之详细攻略 目录 机械设计中基于算法模型的机械优化设计 1.优化设计的数学模型

  4. ML之Clustering之K-means:K-means算法简介、应用、经典案例之详细攻略

    ML之Clustering之K-means:K-means算法简介.应用.经典案例之详细攻略 目录 K-means算法简介 1.K-means算法适用的数据类型​ 2.K-Means算法的全局最优解和 ...

  5. ML之Anaconda:关于Anaconda集成平台简介、安装、使用方法的详细攻略

    ML之Anaconda:关于Anaconda集成平台简介.安装.使用方法的详细攻略 目录 Anaconda简介 1.管理 Python 所用的包 2.管理 Python 不同版本的环境

  6. CREO:CREO软件之零件【模型】操作之复制/粘贴、再生模型、旋转中心开关、隐含、只读、特征操作、模型缩放的简介及其使用方法(图文教程)之详细攻略

    CREO:CREO软件之零件[模型]操作之复制/粘贴.再生模型.旋转中心开关.隐含.只读.特征操作.模型缩放的简介及其使用方法(图文教程)之详细攻略 目录

  7. ML之UL:无监督学习Unsupervised Learning的概念、应用、经典案例之详细攻略

    ML之UL:无监督学习Unsupervised Learning的概念.应用.经典案例之详细攻略 目录 无监督学习Unsupervised Learning的概念 无监督学习Unsupervised ...

  8. ML之SSL:Semi-Supervised Learning半监督学习的简介、应用、经典案例之详细攻略

    ML之SSL:Semi-Supervised Learning半监督学习的简介.应用.经典案例之详细攻略 目录 Semi-Supervised Learning半监督学习的简介 1.直推学习Trans ...

  9. Auto CAD:CAD三维建模设计之常用工具(实体、曲面、网格)之详细攻略

    Auto CAD:CAD三维建模设计之常用工具(常用工具.实体.曲面.网格)之详细攻略 目录 CAD三维建模设计之常用工具(常用工具.实体.曲面.网格)之详细攻略 常用工具 实体

最新文章

  1. physx选择显卡还是cpu_工控机如何选购cpu,工控机cpu选择盒装好还是散装好
  2. editor修改样式 vue_vue-quill-editor的使用及个性化定制操作
  3. 使用spark-sql-perf评测spark 2.0
  4. 成功解决sklearn\cross_validation.py:41: DeprecationWarning: This module was deprecated in version 0.18 i
  5. TextView跑步灯效果及在特殊情况下无效的解决方案
  6. solve函数c语言_数值计算方法编程作业(C语言版)汇总
  7. WebHook 与jenkins
  8. JS判断字符串是否为整数--简单的正则判断
  9. 设计模式:模板方法模式(Template Method)
  10. [设计模式]代理模式
  11. Java Swing井字游戏
  12. 【渝粤教育】电大中专职业应用写作作业 题库
  13. vc6.0 绘制散点图_vc有关散点图的一切
  14. 嵌入式开发中模拟SPI的驱动
  15. MutualNet:一种“宽度-输入分辨率”互相学习的网络轻量化方法
  16. UnityShader13:渐变与遮罩
  17. ASP.NET - 一般处理程序获取session值
  18. linux虚拟机对外部sd卡格式化和分区
  19. SpringBoot 启动类 @SpringBootApplication 注解 以及执行流程
  20. boost库的安装和使用

热门文章

  1. wxtemple.class.php,ThinkPHP3.2.3实现推送微信模板消息
  2. SQL PLUS命令使用大全(转,特有用)
  3. G、S、C、P、T STATE
  4. HTML5新特性知识点总结
  5. 离线环境遇到Problems loading reference..Unable to load schema from https-解决篇
  6. [DP]Apple Catching G
  7. 什么是服务器?服务器有哪几种类型?
  8. 母牛的故事——无脑模拟解法
  9. 打印系统开发(63)——C# 实现虚拟打印机 HP Color LaserJet 4500 (2) True Type Font字体显示
  10. 入侵oracle数据库时常用的操作命令整理