机器学习梯度下降法应用波士顿房价预测
目录
- 1 线性回归api介绍
- 小结
- 2 波士顿房价预测
- 2.1 案例背景介绍
- 2.2 案例分析
- 2.3 回归性能评估
- 2.4 代码实现
- 2.4.1 正规方程
- 2.4.2 梯度下降法
- 2.5 小结
1 线性回归api介绍
机器学习梯度下降算法:https://blog.csdn.net/ZGL_cyy/article/details/127037949
- sklearn.linear_model.LinearRegression(fit_intercept=True)
- 通过正规方程优化
- 参数
- fit_intercept:是否计算偏置
- 属性
- LinearRegression.coef_:回归系数
- LinearRegression.intercept_:偏置
- sklearn.linear_model.SGDRegressor(loss=“squared_loss”, fit_intercept=True, learning_rate =‘invscaling’, eta0=0.01)
- SGDRegressor类实现了随机梯度下降学习,它支持不同的loss函数和正则化惩罚项来拟合线性回归模型。
- 参数:
- loss:损失类型
- loss=”squared_loss”: 普通最小二乘法
- fit_intercept:是否计算偏置
- learning_rate : string, optional
- 学习率填充
- ‘constant’: eta = eta0
- ‘optimal’: eta = 1.0 / (alpha * (t + t0))
- ‘invscaling’: eta = eta0 / pow(t, power_t)[default]
- power_t=0.25:存在父类当中
- 对于一个常数值的学习率来说,可以使用learning_rate=’constant’ ,并使用eta0来指定学习率。
- loss:损失类型
- 属性:
- SGDRegressor.coef_:回归系数
- SGDRegressor.intercept_:偏置
sklearn提供给我们两种实现的API, 可以根据选择使用
小结
- 正规方程
- sklearn.linear_model.LinearRegression()
- 梯度下降法
- sklearn.linear_model.SGDRegressor()
2 波士顿房价预测
2.1 案例背景介绍
- 数据介绍
给定的这些特征,是专家们得出的影响房价的结果属性。我们此阶段不需要自己去探究特征是否有用,只需要使用这些特征。到后面量化很多特征需要我们自己去寻找
2.2 案例分析
回归当中的数据大小不一致,是否会导致结果影响较大。所以需要做标准化处理。
- 数据分割与标准化处理
- 回归预测
- 线性回归的算法效果评估
2.3 回归性能评估
均方误差(Mean Squared Error)MSE)评价机制:
注:yi为预测值, 为真实值
思考:MSE和最小二乘法的区别是?
- sklearn.metrics.mean_squared_error(y_true, y_pred)
- 均方误差回归损失
- y_true:真实值
- y_pred:预测值
- return:浮点数结果
2.4 代码实现
2.4.1 正规方程
def linear_model1():"""线性回归:正规方程:return:None"""# 1.获取数据data = load_boston()# 2.数据集划分x_train, x_test, y_train, y_test = train_test_split(data.data, data.target, random_state=22)# 3.特征工程-标准化transfer = StandardScaler()x_train = transfer.fit_transform(x_train)x_test = transfer.fit_transform(x_test)# 4.机器学习-线性回归(正规方程)estimator = LinearRegression()estimator.fit(x_train, y_train)# 5.模型评估# 5.1 获取系数等值y_predict = estimator.predict(x_test)print("预测值为:\n", y_predict)print("模型中的系数为:\n", estimator.coef_)print("模型中的偏置为:\n", estimator.intercept_)# 5.2 评价# 均方误差error = mean_squared_error(y_test, y_predict)print("误差为:\n", error)return None
2.4.2 梯度下降法
def linear_model2():"""线性回归:梯度下降法:return:None"""# 1.获取数据data = load_boston()# 2.数据集划分x_train, x_test, y_train, y_test = train_test_split(data.data, data.target, random_state=22)# 3.特征工程-标准化transfer = StandardScaler()x_train = transfer.fit_transform(x_train)x_test = transfer.fit_transform(x_test)# 4.机器学习-线性回归(特征方程)estimator = SGDRegressor(max_iter=1000)estimator.fit(x_train, y_train)# 5.模型评估# 5.1 获取系数等值y_predict = estimator.predict(x_test)print("预测值为:\n", y_predict)print("模型中的系数为:\n", estimator.coef_)print("模型中的偏置为:\n", estimator.intercept_)# 5.2 评价# 均方误差error = mean_squared_error(y_test, y_predict)print("误差为:\n", error)return None
我们也可以尝试去修改学习率
estimator = SGDRegressor(max_iter=1000,learning_rate="constant",eta0=0.1)
此时我们可以通过调参数,找到学习率效果更好的值。
2.5 小结
- 正规方程和梯度下降法api在真实案例中的使用
- 线性回归性能评估
- 均方误差
机器学习梯度下降法应用波士顿房价预测相关推荐
- Python机器学习/数据挖掘项目实战 波士顿房价预测 回归分析
Python机器学习/数据挖掘项目实战 波士顿房价预测 回归分析 此数据源于美国某经济学杂志上,分析研究波士顿房价( Boston HousePrice)的数据集. 在这个项目中,你将利用马萨诸塞州波 ...
- 机器学习线性回归实践,波士顿房价预测,手写梯度下降
波士顿房价预测,手写梯度下降,python实现 数据集介绍 每条数据包含房屋以及房屋周围的详细信息.其中包含城镇犯罪率,一氧化氮浓度,住宅平均房间数,到中心区域的加权距离以及自住房平均房价等等. CR ...
- 机器学习实战二:波士顿房价预测 Boston Housing
波士顿房价预测 Boston housing 这是一个波士顿房价预测的一个实战,上一次的Titantic是生存预测,其实本质上是一个分类问题,就是根据数据分为1或为0,这次的波士顿房价预测更像是预测一 ...
- 【梯度下降在波士顿房价预测中的应用】
数据准备 我们首先需要加载波士顿房价数据集.该数据集包含房屋特征信息和对应的房价标签. import pandas as pd import numpy as npdata_url = "h ...
- 波士顿房价预测python决策树_波士顿房价预测 - 最简单入门机器学习 - Jupyter
机器学习入门项目分享 - 波士顿房价预测 该分享源于Udacity机器学习进阶中的一个mini作业项目,用于入门非常合适,刨除了繁琐的部分,保留了最关键.基本的步骤,能够对机器学习基本流程有一个最清晰 ...
- 机器学习(11)线性回归(2)实战 -- 正规方程优化、梯度下降优化(波士顿房价预测)
目录 一.波士顿房价预测(正规方程优化) API 1.获取数据集 2.划分数据集 3.标准化 4. 创建预估器,得到模型 5.模型评估(均方差评估) 代码 二.波士顿房价预测(正规方程优化) API ...
- 机器学习入门实践——线性回归模型(波士顿房价预测)
机器学习入门实践--线性回归模型(波士顿房价预测) 一.背景介绍 给定一个大小为 n n n的数据集 { y i , x i 1 , . . . , x i d } i = 1 n {\{y_{i}, ...
- 波士顿房价预测——机器学习入门级案例
一.数据处理 1.1 数据集介绍 本实验使用波士顿房价预测数据集,共506条样本数据,每条样本包含了13种可能影响房价的因素和该类房屋价格的中位数,各字段含义如下表所示: 字段名 类型 含义 CRIM ...
- ML之回归预测:利用13种机器学习算法对Boston(波士顿房价)数据集【13+1,506】进行回归预测(房价预测)+预测新数据得分
ML之回归预测:利用13种机器学习算法对Boston(波士顿房价)数据集[13+1,506]进行回归预测(房价预测)+预测新数据得分 导读 本文章基于前边的一篇文章,对13种机器学习的回归模型性能比较 ...
最新文章
- RxJava 过滤操作符 throttleFirst 与 throttleLast 以及 sample
- C++ fscanf函数分割读取文本文件
- 统计日志中ip访问次数并排序的三种方法
- 【CV】OpenCV 入门之旅
- [置顶] Postman插件下载安装与使用教程
- 【OpenSSL】OpenSSL之MD5
- VMware-viewagent-direct-connection安装
- Win7开发系列: Win7 UAC帮助类
- 华为mate40pro是鸿蒙系统么,预装鸿蒙OS系统,华为Mate40Pro鸿蒙版即将发布,略有遗憾...
- 如何实现上一条、下一条的功能
- Linux下apache+php+mysql配置攻略
- bzoj 1689: [Usaco2005 Open] Muddy roads 泥泞的路(模拟)
- iOS 截屏 长图 拼图
- 孙鑫视频VC编程 优酷系列
- apk反编译教程+工具
- linux 修改密码 authen,Linux系统下root用户执行passwd修改密码时报错Authentication to
- 如何把视频和音频合并?手把手教你合并
- 孙思邈的养生哲学和孔子的阴阳和谐之道
- 华为首款台式机计算机发布,华为首款商用台式机发布,或再成商用PC市场破局者...
- 从零入门激光SLAM(一)——什么是SLAM
热门文章
- raise XLRDError(FILE_FORMAT_DESCRIPTIONS[file_format]+‘; not sup
- 沙龙与华为强强携手,机甲龙惊艳广州车展
- RHCI 搭建 rhca 教室环境
- 分支-12. 计算火车执行时间(15)
- 山东理工大学pta答案 C语言,山东理工大学高分子化学题库附答案.docx
- el-date-picker 日期过滤周末节假日
- 2012年度注册测绘师资格考试江西-考区合格人员名单
- 计算机与科学专硕考研院校排名,22考研|全国首次专硕院校评估排名,看看有你想报的没...
- Freeswitch的mod_av模块优化
- CCF 行车路线 100分