• 在做数据升维的时候,最常见的手段就是将已知维度进行相乘(或者自乘)来构建新的维度

    • 使用 np.concatenate()进行简单的,幂次合并,注意数据合并的方向axis = 1

    • 数据可视化时,注意切片,因为数据升维后,多了平方这一维

# 4、多项式升维 + 普通线性回归
X = np.concatenate([X,X**2],axis = 1)
  • 使用 PolynomialFeatures 进行 特征升维
from sklearn.preprocessing import PolynomialFeatures
poly = PolynomialFeatures()   # 使用PolynomialFeatures进行特征升维
poly.fit(X,y)
X = poly.transform(X)
  • 调整字体大小: plt.rcParams[ 'font.size' ] = 18
import matplotlib.pyplot as plt
plt.rcParams['font.size'] = 18

1.1、多项式回归基本概念

对于多项式回归来说主要是为了扩展线性回归算法来适应更广泛的数据集,比如我们数据集有两个维度 ​,那么用多元线性回归公式就是: ,当我们使用二阶多项式升维的时候,数据集就从原来的 扩展成了  。因此多元线性回归就得去多计算三个维度所对应的w值:

import numpy as np
import matplotlib.pyplot as plt
from sklearn.linear_model import LinearRegression# 1、创建数据,并进行可视化
X = np.linspace(-1,11,num = 100)
y = (X - 5)**2 + 3*X -12 + np.random.randn(100)
X = X.reshape(-1,1)
plt.scatter(X,y)# 2、创建预测数据
X_test = np.linspace(-2,12,num = 200).reshape(-1,1)# 3、不进行升维 + 普通线性回归
model_1 = LinearRegression()
model_1.fit(X,y)
y_test_1 = model_1.predict(X_test)
plt.plot(X_test,y_test_1,color = 'red')# 4、多项式升维 + 普通线性回归
X = np.concatenate([X,X**2],axis = 1)
model_2 = LinearRegression()
model_2.fit(X,y)
# 5、测试数据处理,并预测
X_test = np.concatenate([X_test,X_test**2],axis = 1)
y_test_2 = model_2.predict(X_test)# 6、数据可视化,切片操作
plt.plot(X_test[:,0],y_test_2,color = 'green')

1.2 使用PolynomialFeatures进行特征升维

import matplotlib.pyplot as plt
import numpy as np
from sklearn.preprocessing import PolynomialFeatures,StandardScaler
from sklearn.linear_model import SGDRegressor# 1、创建数据,并进行可视化
X = np.linspace(-1,11,num = 100)
y = (X - 5)**2 + 3*X -12 + np.random.randn(100)
X = X.reshape(-1,1)
plt.scatter(X,y)# 3、使用PolynomialFeatures进行特征升维
poly = PolynomialFeatures()   # 特征升维
poly.fit(X,y)
X = poly.transform(X)
s = StandardScaler()    # 归一化
X = s.fit_transform(X)# 4、训练模型
model = SGDRegressor(penalty='l2',eta0 = 0.01)
model.fit(X,y)# 2、创建预测数据
X_test = np.linspace(-2,12,num = 200).reshape(-1,1)
X_test = poly.transform(X_test)      # 特征升维
X_test_norm = s.transform(X_test)    # 归一化
y_test = model.predict(X_test_norm)
plt.plot(X_test[:,1],y_test,color = 'green')

1.3 多项式预测

天猫双十一销量与年份的关系是多项式关系!假定,销量和年份之间关系是三次幂关系:

import numpy as np
from sklearn.linear_model import SGDRegressor
import matplotlib.pyplot as plt
from sklearn.preprocessing import PolynomialFeatures
from sklearn.preprocessing import StandardScaler
plt.figure(figsize=(12,9))# 1、创建数据,年份数据2009 ~ 2019
X = np.arange(2009,2020)
y = np.array([0.5,9.36,52,191,350,571,912,1207,1682,2135,2684])# 2、年份数据,均值移除,防止某一个特征列数据天然的数值太大而影响结果
X = X - X.mean()
X = X.reshape(-1,1)# 3、构建多项式特征,3次幂
poly = PolynomialFeatures(degree=3)
X = poly.fit_transform(X)
s = StandardScaler()
X_norm = s.fit_transform(X)# 4、创建模型
model = SGDRegressor(penalty='l2',eta0 = 0.5,max_iter = 5000)
model.fit(X_norm,y)# 5、数据预测
X_test = np.linspace(-5,6,100).reshape(-1,1)
X_test = poly.transform(X_test)
X_test_norm = s.transform(X_test)
y_test = model.predict(X_test_norm)# 6、数据可视化
plt.plot(X_test[:,1],y_test,color = 'green')
plt.bar(X[:,1],y)
plt.bar(6,y_test[-1],color = 'red')
plt.ylim(0,4096)
plt.text(6,y_test[-1] + 100,round(y_test[-1],1),ha = 'center')
_ = plt.xticks(np.arange(-5,7),np.arange(2009,2021))

08- 数据升维 (PolynomialFeatures) (数据处理)相关推荐

  1. numpy的array数组的数据升维与降维使用方法自学总结

    本文主要介绍numpy中数据升维与降维问题 升维 注意数组的形式 是n行1列 还是1行n列 1.numpy.atleast_2d(数组名) 将输入视为至少具有二维的数组 2.numpy.atleast ...

  2. python升维方法_python机器学习12:数据“升维”

    1.向数据集添加交互式特征 在实际应用中,常常会遇到数据集的特征不足的情况,要解决这个问题,就需要对数据集的特征进行扩充.这里我们介绍两种在统计建模中常用的方法---交互式特征(Interaction ...

  3. 算法笔记(18)数据升维及Python代码实现

    数据集特征不足的情况下,需要对数据集的特征进行扩充,两种方法:交互式特征和多项式特征. 向特征集添加交互式特征 交互式特征是在原始数据特征中添加交互项,使特征数量增加. Python代码实现: X_m ...

  4. python升维方法_数据升维

    我们在实际应用中会遇到数据集特征不足的情况,要解决这个问题,就需要对数据集的特征进行扩充, 一般使用两种方法: 交互式特征(Interaction Features) 多项式特征(Ploynomial ...

  5. 数据升维到希尔伯特空间

    将数据转换到希尔伯特空间 前言 向量空间:也称线性空间(线性空间对加法和数乘是封闭的,即输出结果仍在该空间内).该空间集合中对应的元素是向量.二维.三维空间中每个点都可用唯一个向量来表示,因此也是向量 ...

  6. numpy数据升维与降维

    https://blog.csdn.net/weixin_44776220/article/details/105618704

  7. 核函数是什么-数据的升维与降维

    核函数是什么-数据的升维与降维 核函数是什么-数据的升维与降维 数据升维-从二维空间升维到三维希尔伯特空间 将二维空间数据x=(xi,xj)x=(x^i,x^j)x=(xi,xj)升到三维,因此需要映 ...

  8. 哈儿小波分解和重构(降维和升维)实现算法

    [0]README 0.1)本文旨在讲解 哈儿小波变换(分解和重构)进行数据的降维和升维: [timestamp: 1703281610]时隔几个月再来review 哈儿小波变换算法的具体思路: 1) ...

  9. [机器学习与scikit-learn-33]:算法-回归-通过PolynomialFeatures实现数据的升维

    作者主页(文火冰糖的硅基工坊):文火冰糖(王文兵)的博客_文火冰糖的硅基工坊_CSDN博客 本文网址:https://blog.csdn.net/HiWangWenBing/article/detai ...

最新文章

  1. Megastore:为交互式服务提供可扩展的高可用性存储
  2. 使用DM框架实现一个小的计算器
  3. 支持javascript的博客汇总
  4. cad文字插件_超好用的4个CAD应用程序,让你提升工作幸福感,裂墙推荐
  5. php解析二级json,PHP Json 解析
  6. c语言图片输出,C语言输出图片?
  7. ecshop二次开发笔记
  8. 华三模拟器 HCL无线网络搭建+AC桥接到本地
  9. NodeJS 开发多人实时对战游戏服务器 (一)
  10. 文件服务器角色提供多种服务 其中,Win2008实战:配置双节点打印服务器故障转移群集...
  11. 微软服务器模式表格多维,用挖掘功能实现多元回归分析
  12. 蓝牙人员定位追踪系统解决方案,蓝牙定位技术应用全面-新导智能
  13. 在vue/html中添加单选按钮
  14. 亲测源码小旋风蜘蛛池站群X8.51+自带30套模板
  15. 2013 province java c-2 组素数
  16. 职场中如何谈加薪,这么谈,成了也等于失败
  17. 链路捆绑与端口聚合原理与实验结合理解小白看了都秒懂(华为ensp模拟器)不懂不可能的
  18. Flutter 之简洁实用的图片编辑器
  19. selenium——浏览器插件
  20. 一颗芯片的内部设计原理和结构

热门文章

  1. 用计算机faded,求faded简谱(一定是对应计算机的)
  2. 【转】BigInteger BigDecimal
  3. 俺老刘终于可以将指针传递给lua了!
  4. AWS EC2上托管网站用cloudfront分配使用证书https
  5. 自学AE AK大神笔记001_简易替换背景
  6. k8s--重启后报错:The connection to the server lb.kubesphere.local:6443 was refused - did you specify the r
  7. 电脑怎样录屏和摄像头?这两种方法都能搞定
  8. 大数据+决策人挖掘+邮件推广+whatapp助手=3个月出50W货值
  9. 随笔录—2014.6.12
  10. 基于单片机的热电偶测温仿真设计(#0004)