数据特征处理

在机器学习的算法训练中,有很多数据的特征值不止一个,特征值中有些属性的数字过大,从而对计算结果的影响太大,但是实际情况是每个属性都同等重要,这时候就要处理这种不同取值范围的特征值,通常采用数值归一化,将取值范围处理为0-1或者其他范围之间。

1.数据归一化:

sklearn归一化API

from sklearn.preprocessing import MinMaxScaler

举例:

 mm=MinMaxScaler(feature_range=(0,1))#feature_range默认为0到1可以更改data=mm.fit_transform([[90,20,4,10],[40,24,3,20],[70,30,5,30]])print(data)

结果:

sklearn标准化API(正态分布)


举例

st=StandardScaler()
data=st.fit_transform([[1,-1,3],[2,4,2],[4,6,-1]])
print(data)

结果

python机器学习之特征值处理(sklearn)相关推荐

  1. python机器学习之门之sklearn的使用(使用鸢尾花数据集)

    sklearn全称为scikit learn 专门提供了python机器学习的模块 是一个高效的数据分析算法工具 建议在numpy scipy matplotlib上 对于大多数机器学习 通常有以下四 ...

  2. [python机器学习及实践(2)]Sklearn实现朴素贝叶斯

    1.朴素贝叶斯简介 朴素贝叶斯(Naive Bayes)是一个基于贝叶斯理论的分类器.它会单独考量每一唯独特征被分类的条件概率,进而综合这些概率并对其所在的特征向量做出分类预测. 因此,朴素贝叶斯的基 ...

  3. Python机器学习笔记:sklearn库的学习

    自2007年发布以来,scikit-learn已经成为Python重要的机器学习库了,scikit-learn简称sklearn,支持包括分类,回归,降维和聚类四大机器学习算法.还包括了特征提取,数据 ...

  4. Python机器学习库sklearn的安装

    Python机器学习库sklearn的安装 scikit-learn是Python的一个开源机器学习模块,它建立在NumPy,SciPy和matplotlib模块之上能够为用户提供各种机器学习算法接口 ...

  5. python 机器学习_基于 Python 语言的机器学习工具Sklearn

    本篇介绍了Sklearn机器学习基础,从Sklearn的简介,模块以及与tensorflow的优劣势对比来了解基于Python语言的机器学习工具.    01.Sklearn简介 sklearn(sc ...

  6. python机器学习-sklearn挖掘乳腺癌细胞(五)

    python机器学习-sklearn挖掘乳腺癌细胞( 博主亲自录制) 网易云观看地址 https://study.163.com/course/introduction.htm?courseId=10 ...

  7. python机器学习库sklearn与graphlab与opencv的安装

    1.安装python 首先安装python3.5 Link 然后安装python2.7 Link 注意选择合适的版本(记得之后安装的GraphLab只能用64位,也只能使用python2) 2.安装使 ...

  8. Python机器学习Sklearn入门之神经网络

    Python机器学习Sklearn入门之神经网络 MLP 神经网络算法 MLP 神经网络算法函数位于 neural_network 神经网络模块,函数名是 MLPClassifier,接口是 MLPC ...

  9. sklearn实现一元线性回归 【Python机器学习系列(五)】

    sklearn实现一元线性回归 [Python机器学习系列(五)] 文章目录 1.获取数据 2.线性回归模型 大家好,我是侯小啾!  本期blog分享的内容是通过sklearn库实现一元线性回归.相比 ...

  10. 基于sklearn进行蝴蝶花分类案例(Python机器学习笔记)

    本文背景   原有在网易云课堂学习课程Python机器学习简介,只不过好久没看.现想回顾一下,巩固所学内容. 数据集简介   Iris数据集是常用的分类实验数据集,由Fisher, 1936收集整理. ...

最新文章

  1. C++忽略第三方库的警告
  2. 【Android 插件化】“ 插桩式 “ 插件化框架 ( 类加载器创建 | 资源加载 )
  3. SpringBoot快速集成Apollo配置中心
  4. 转: ubuntu apt-get 与 aptitude 用法与区别
  5. setuptools安装_在Ubuntu 18.04系统上安装ERPNext ERP
  6. 韩信大招:一致性哈希
  7. pytorch 创建神经网络
  8. opencv 图像几何变换
  9. ssh(安全协议外壳)
  10. 使用VBA,优化处理Excel表格
  11. 工字型钢弹性截面模量计算公式_弹性截面模量与塑性截面模量的例析
  12. 程序员,技术主管和架构师
  13. Windows操作系统----事件日志----事件查看器
  14. 监听Solidity合约事件
  15. 每部都是经典 一生不能不看的电影
  16. 读书笔记(十五)--将才
  17. CMStudio中出现‘$错误‘ is not a vaild integer value如何解决
  18. 【机器人】基于向量积法的雅可比矩阵求解和应用
  19. K-Means聚类 和 高斯混合模型(GMM)
  20. 干货:程序员到底该不该接私活?

热门文章

  1. js获取服务器控件DropDownList所选中的各项属性
  2. java桌面项目打包_by icewee_写得太棒了,直接转载了
  3. Oracle字符集设置
  4. The Semantics of Constructors(拷贝构造函数之编译背后的行为)
  5. MVC 中 Html.RenderPartial()与Html.Partial()区别
  6. Hough检测直线原理及c++代码
  7. 图像去雾之何凯明暗通道先验去雾算法原理及c++代码实现
  8. llvm+clang 添加 LTO(Link Time Optimization) 支持
  9. Spring依赖注入流程【完整版】(populateBean方法内部执行流程)
  10. 常见排序算法之基数排序