Sklearn——用Sklearn实现线性回归(LinearRegression)
文章目录
- 1.前言
- 2.Sklearn实战线性回归
- 2.1.导入必要模块
- 2.2.加载数据
- 2.3.训练+预测
1.前言
Sklearn 中的datasets,很多而且有用,可以用来学习算法模型。
比如: boston 房价, 糖尿病, 数字, Iris 花。
也可以生成虚拟的数据,例如用来训练线性回归模型的数据,可以用函数来生成。
例如,点击进入 boston 房价的数据,可以看到 sample 的总数,属性,以及 label 等信息。
如果是自己生成数据,按照函数的形式,输入 sample,feature,target 的个数等等。
sklearn.datasets.make_regression(n_samples=100, n_features=100, n_informative=10, n_targets=1, bias=0.0, effective_rank=None, tail_strength=0.5, noise=0.0, shuffle=True, coef=False, random_state=None)[source]
2.Sklearn实战线性回归
2.1.导入必要模块
from sklearn import datasets #导入数据模块
from sklearn.model_selection import train_test_split #导入切分训练集、测试集模块
from sklearn.linear_model import LinearRegression
2.2.加载数据
加载 boston房价 的数据,把属性存在 X,类别标签存在 y:
boston_data = datasets.load_boston() #加载数据
data_x = boston_data.data #数据
data_y = boston_data.target #标签
观察一下数据集
print(data_x)
print(data_y)
把数据集分为训练集和测试集,其中 test_size=0.3,即测试集占总数据的 30%:
x_train, x_test, y_train, y_test = train_test_split(data_x, data_y,test_size = 0.3)
print(y_train)
print(y_test)
可以看到分开后的数据集,顺序也被打乱,这样更有利于学习模型:
2.3.训练+预测
定义模块方式 LinearRegression(), 用 fit 来训练 training data,这一步就完成了训练的所有步骤, 后面的 model 就已经是训练好的模型,可以直接用来 predict 测试集的数据, 对比用模型预测的值与真实的值,可以看到大概模拟出了数据,但是有误差,是不会完完全全预测正确的。
model = LinearRegression() #实例化模型
model.fit(x_train, y_train) #用训练数据训练
print(model.predict(x_test)) #预测
print(y_test) #实际
为了提高准确度,可以通过尝试不同的 model,不同的参数,不同的预处理等方法,入门的话可以直接用默认值。
Sklearn——用Sklearn实现线性回归(LinearRegression)相关推荐
- Python数模笔记-Sklearn(4)线性回归
1.什么是线性回归? 回归分析(Regression analysis)是一种统计分析方法,研究自变量和因变量之间的定量关系.回归分析不仅包括建立数学模型并估计模型参数,检验数学模型的可信度,也包括利 ...
- 【python学习】-使用sklearn对数据进行线性回归,并绘制回归线
使用sklearn对数据进行线性回归,并绘制回归线 基本思想 代码实现 在科研工作中,有时得到一组或者几组数据,为了研究数据之间是否存在线性关系,一般会想到拟合数据,看下数据的线性关系.严格地说,是使 ...
- scikit-learn 线性回归 LinearRegression 参数详解
scikit-learn 线性回归 LinearRegression 参数详解 LinearRegression 参数详解 参考文献 LinearRegression 参数详解 # 从 sklearn ...
- 多元线性回归LinearRegression
目录 1.1多元线性回归的基本原理 1.2 最小二乘法求解多元线性回归的参数 1.3 linear_model.LinearRegression 1.4 案例 1.5 多元线性回归的模型评估指标 1. ...
- svd降维 python案例_菜菜的机器学习sklearn实战-----sklearn中的降维算法PCA和SVD
菜菜的机器学习sklearn实战-----sklearn中的降维算法PCA和SVD 概述 从什么叫维度说开来 简单讲,shape中返回了几个数字就是几维. 一张表最多就是一维 当一个数组中存在2张3行 ...
- Python之 sklearn:sklearn.preprocessing中的StandardScaler函数的简介及使用方法之详细攻略
Python之 sklearn:sklearn.preprocessing中的StandardScaler函数的简介及使用方法之详细攻略 目录 sklearn.preprocessing中的Stand ...
- Python之 sklearn:sklearn中的train_test_split函数的简介及使用方法之详细攻略
Python之 sklearn:sklearn中的train_test_split函数的简介及使用方法之详细攻略 目录 sklearn中的train_test_split函数的简介 train_tes ...
- ML之sklearn:sklearn.metrics中常用的函数参数(比如confusion_matrix等 )解释及其用法说明之详细攻略
ML之sklearn:sklearn.metrics中常用的函数参数(比如confusion_matrix等 )解释及其用法说明之详细攻略 目录 sklearn.metrics中常用的函数参数 con ...
- Python之 sklearn:sklearn中的RobustScaler 函数的简介及使用方法之详细攻略
Python之 sklearn:sklearn中的RobustScaler 函数的简介及使用方法之详细攻略 目录 sklearn中的RobustScaler 函数的简介及使用方法 sklearn中的R ...
- ML之sklearn:sklearn库中的ShuffleSplit()函数和StratifiedShuffleSplit()函数的讲解
ML之sklearn:sklearn库中的ShuffleSplit()函数和StratifiedShuffleSplit()函数的讲解 目录 sklearn库中的ShuffleSplit()函数和St ...
最新文章
- ASP.NET 2.0 读取配置文件[INI](示例代码下载)
- 后端说:只是你不懂怎么用 headers!
- InstallUtil.exe版本引起安装windows services 服务遇到的问题,System.BadImageFormatException...
- 19、Power Query-快速分析各产品的销售情况
- C++ sizeof总结
- dcdc芯片效率不高的原因_半导体厂商如何做芯片的出厂测试?
- java 牛生小牛_例题:大牛生小牛的问题解决方法
- 服装CAD软件测试初学者,CAD服装打版基础教程
- 如何使用matlab绘制晶胞结构示意图
- 立即寻址,直接寻址,间接寻址
- 数学中 arg min是什么意思
- STM32 触摸屏触摸功能
- 设置bing桌面壁纸
- Mini XLR 平衡耳机 I/O 接线指引
- linux提取手机rom,提取安卓手机ROM固件中的APP
- Java岗大厂面试百日冲刺 - 日积月累,每日三题【Day36】—— 实战那些事儿1
- 好好学习天天向上之InfoPath学习系列(零):写在最前面
- 最新COS美女写真网站整站数据打包+附搭建教程/实测可用
- 制作winpe ISO(x86/amd64/ARM)
- 语音合成(speech synthesis)方向六:歌唱合成(singing voice synthesis)
热门文章
- 2017 年大数据、物联网与 AI 的趋势预测
- 添加Maven(mvn)、sbt的国内仓库
- python两个乘号_详解python中*号的用法!(含实例:零基础也看能懂)
- 3使用技巧_办公小技巧:3+2 灵活使用WPS集成环境
- 三维点云学习(1)上-PCA主成分分析 法向量估计
- Postgresql Hot_Standby 流复制 基于Linux 对postgresql 和 linux 会基本的操作
- Android下xml中RelativeLayout布局常见属性
- java类注解是否可以通过实现接口或继承父类的方式获得
- 一道很简单却也很容易入坑的java面试题
- Spring Boot技术之异步任务执行