文章目录

  • 1.前言
  • 2.Sklearn实战线性回归
    • 2.1.导入必要模块
    • 2.2.加载数据
    • 2.3.训练+预测

1.前言

Sklearn 中的datasets,很多而且有用,可以用来学习算法模型。

比如: boston 房价, 糖尿病, 数字, Iris 花。

也可以生成虚拟的数据,例如用来训练线性回归模型的数据,可以用函数来生成。

例如,点击进入 boston 房价的数据,可以看到 sample 的总数,属性,以及 label 等信息。

如果是自己生成数据,按照函数的形式,输入 sample,feature,target 的个数等等。

sklearn.datasets.make_regression(n_samples=100, n_features=100, n_informative=10, n_targets=1, bias=0.0, effective_rank=None, tail_strength=0.5, noise=0.0, shuffle=True, coef=False, random_state=None)[source]

2.Sklearn实战线性回归

2.1.导入必要模块

from sklearn import datasets    #导入数据模块
from sklearn.model_selection import train_test_split   #导入切分训练集、测试集模块
from sklearn.linear_model import LinearRegression

2.2.加载数据

加载 boston房价 的数据,把属性存在 X,类别标签存在 y:

boston_data = datasets.load_boston()     #加载数据
data_x = boston_data.data    #数据
data_y = boston_data.target  #标签

观察一下数据集

print(data_x)
print(data_y)

把数据集分为训练集和测试集,其中 test_size=0.3,即测试集占总数据的 30%:

x_train, x_test, y_train, y_test = train_test_split(data_x, data_y,test_size = 0.3)
print(y_train)
print(y_test)

可以看到分开后的数据集,顺序也被打乱,这样更有利于学习模型:

2.3.训练+预测

定义模块方式 LinearRegression(), 用 fit 来训练 training data,这一步就完成了训练的所有步骤, 后面的 model 就已经是训练好的模型,可以直接用来 predict 测试集的数据, 对比用模型预测的值与真实的值,可以看到大概模拟出了数据,但是有误差,是不会完完全全预测正确的。

model = LinearRegression()   #实例化模型
model.fit(x_train, y_train)  #用训练数据训练
print(model.predict(x_test))  #预测
print(y_test)     #实际

为了提高准确度,可以通过尝试不同的 model,不同的参数,不同的预处理等方法,入门的话可以直接用默认值。

Sklearn——用Sklearn实现线性回归(LinearRegression)相关推荐

  1. Python数模笔记-Sklearn(4)线性回归

    1.什么是线性回归? 回归分析(Regression analysis)是一种统计分析方法,研究自变量和因变量之间的定量关系.回归分析不仅包括建立数学模型并估计模型参数,检验数学模型的可信度,也包括利 ...

  2. 【python学习】-使用sklearn对数据进行线性回归,并绘制回归线

    使用sklearn对数据进行线性回归,并绘制回归线 基本思想 代码实现 在科研工作中,有时得到一组或者几组数据,为了研究数据之间是否存在线性关系,一般会想到拟合数据,看下数据的线性关系.严格地说,是使 ...

  3. scikit-learn 线性回归 LinearRegression 参数详解

    scikit-learn 线性回归 LinearRegression 参数详解 LinearRegression 参数详解 参考文献 LinearRegression 参数详解 # 从 sklearn ...

  4. 多元线性回归LinearRegression

    目录 1.1多元线性回归的基本原理 1.2 最小二乘法求解多元线性回归的参数 1.3 linear_model.LinearRegression 1.4 案例 1.5 多元线性回归的模型评估指标 1. ...

  5. svd降维 python案例_菜菜的机器学习sklearn实战-----sklearn中的降维算法PCA和SVD

    菜菜的机器学习sklearn实战-----sklearn中的降维算法PCA和SVD 概述 从什么叫维度说开来 简单讲,shape中返回了几个数字就是几维. 一张表最多就是一维 当一个数组中存在2张3行 ...

  6. Python之 sklearn:sklearn.preprocessing中的StandardScaler函数的简介及使用方法之详细攻略

    Python之 sklearn:sklearn.preprocessing中的StandardScaler函数的简介及使用方法之详细攻略 目录 sklearn.preprocessing中的Stand ...

  7. Python之 sklearn:sklearn中的train_test_split函数的简介及使用方法之详细攻略

    Python之 sklearn:sklearn中的train_test_split函数的简介及使用方法之详细攻略 目录 sklearn中的train_test_split函数的简介 train_tes ...

  8. ML之sklearn:sklearn.metrics中常用的函数参数(比如confusion_matrix等 )解释及其用法说明之详细攻略

    ML之sklearn:sklearn.metrics中常用的函数参数(比如confusion_matrix等 )解释及其用法说明之详细攻略 目录 sklearn.metrics中常用的函数参数 con ...

  9. Python之 sklearn:sklearn中的RobustScaler 函数的简介及使用方法之详细攻略

    Python之 sklearn:sklearn中的RobustScaler 函数的简介及使用方法之详细攻略 目录 sklearn中的RobustScaler 函数的简介及使用方法 sklearn中的R ...

  10. ML之sklearn:sklearn库中的ShuffleSplit()函数和StratifiedShuffleSplit()函数的讲解

    ML之sklearn:sklearn库中的ShuffleSplit()函数和StratifiedShuffleSplit()函数的讲解 目录 sklearn库中的ShuffleSplit()函数和St ...

最新文章

  1. ASP.NET 2.0 读取配置文件[INI](示例代码下载)
  2. 后端说:只是你不懂怎么用 headers!
  3. InstallUtil.exe版本引起安装windows services 服务遇到的问题,System.BadImageFormatException...
  4. 19、Power Query-快速分析各产品的销售情况
  5. C++ sizeof总结
  6. dcdc芯片效率不高的原因_半导体厂商如何做芯片的出厂测试?
  7. java 牛生小牛_例题:大牛生小牛的问题解决方法
  8. 服装CAD软件测试初学者,CAD服装打版基础教程
  9. 如何使用matlab绘制晶胞结构示意图
  10. 立即寻址,直接寻址,间接寻址
  11. 数学中 arg min是什么意思
  12. STM32 触摸屏触摸功能
  13. 设置bing桌面壁纸
  14. Mini XLR 平衡耳机 I/O 接线指引
  15. linux提取手机rom,提取安卓手机ROM固件中的APP
  16. Java岗大厂面试百日冲刺 - 日积月累,每日三题【Day36】—— 实战那些事儿1
  17. 好好学习天天向上之InfoPath学习系列(零):写在最前面
  18. 最新COS美女写真网站整站数据打包+附搭建教程/实测可用
  19. 制作winpe ISO(x86/amd64/ARM)
  20. 语音合成(speech synthesis)方向六:歌唱合成(singing voice synthesis)

热门文章

  1. 2017 年大数据、物联网与 AI 的趋势预测
  2. 添加Maven(mvn)、sbt的国内仓库
  3. python两个乘号_详解python中*号的用法!(含实例:零基础也看能懂)
  4. 3使用技巧_办公小技巧:3+2 灵活使用WPS集成环境
  5. 三维点云学习(1)上-PCA主成分分析 法向量估计
  6. Postgresql Hot_Standby 流复制 基于Linux 对postgresql 和 linux 会基本的操作
  7. Android下xml中RelativeLayout布局常见属性
  8. java类注解是否可以通过实现接口或继承父类的方式获得
  9. 一道很简单却也很容易入坑的java面试题
  10. Spring Boot技术之异步任务执行