介绍

回归模型

线性回归

局部加权线性回归

岭回归

套索(Lasso)回归

逐步线性回归

结论与分析

可访问实现机器学习的循序渐进指南系列汇总，获取本系列完成文章列表。

介绍

通常存在变量之间的关系。实际上，这种关系可以分为两类，即确定关系和不确定关系。确定性关系可以用函数表示。确定性关系也称为相关性，可以用回归分析进行研究。

通常，线性回归模型是：

最优化可以通过最小损失函数来确定：

回归模型

线性回归包括线性回归，局部加权线性回归，岭回归，套索回归和逐步线性回归。

线性回归

线性回归的参数可以通过梯度下降法或正则表达式计算。由于梯度下降法已经在实现机器学习的循序渐进指南IV——逻辑回归中引入，因此我们在本文中介绍具有正则表达式的解决方案。

首先，计算损失函数的导数：

然后，使导数等于0，我们可以得到：

最后，是：

其中X是训练数据，Y是相应的标签。线性回归的代码如下所示：

def standardLinearRegression(self, x, y):if self.norm_type == "Standardization":x = preProcess.Standardization(x)else:x = preProcess.Normalization(x)xTx = np.dot(x.T, x)if np.linalg.det(xTx) == 0:   # calculate the Determinant of xTxprint("Error: Singluar Matrix !")returnw = np.dot(np.linalg.inv(xTx), np.dot(x.T, y))return w

局部加权线性回归

使用最小均方误差（MMSE）的无偏估计，它在线性回归中是不合适的。为了解决这个问题，我们在要预测的点周围的点上分配权重。然后，我们对其应用常规回归分析。局部加权线性回归的损失函数是：

像线性回归一样，我们计算损失函数的导数并使其等于0。最优的是

局部加权线性回归中的权重类似于SVM中的核函数(kernel function)，其由下式给出：

局部加权线性回归的代码如下所示：

def LWLinearRegression(self, x, y, sample):if self.norm_type == "Standardization":x = preProcess.Standardization(x)else:x = preProcess.Normalization(x)sample_num = len(x)weights = np.eye(sample_num)for i in range(sample_num):diff = sample - x[i, :]weights[i, i] = np.exp(np.dot(diff, diff.T)/(-2 * self.k ** 2))xTx = np.dot(x.T, np.dot(weights, x))if np.linalg.det(xTx) == 0:print("Error: Singluar Matrix !")returnresult = np.dot(np.linalg.inv(xTx), np.dot(x.T, np.dot(weights, y)))return np.dot(sample.T, result)

岭回归

如果特征维度大于样本数量，则输入矩阵不是满秩，其逆矩阵不存在。为了解决这个问题，岭回归增加了到矩阵的非奇异性。实际上，对于岭回归的损失函数，等于加上L2正则化，即：

像线性回归一样，我们计算损失函数的导数并使其等于0.最优的是：

岭回归的代码如下所示：

def ridgeRegression(self, x, y):if self.norm_type == "Standardization":x = preProcess.Standardization(x)else:x = preProcess.Normalization(x)feature_dim = len(x[0])xTx = np.dot(x.T, x)matrix = xTx + np.exp(feature_dim)*self.lamdaif np.linalg.det(xTx) == 0:print("Error: Singluar Matrix !")returnw = np.dot(np.linalg.inv(matrix), np.dot(x.T, y))return w

套索(Lasso)回归

与岭回归一样，套索(Lasso)回归在损失函数上加上L1正则化，即：

因为L1正则化包含绝对值表达式，所以损失函数不能在任何地方导出。因此，我们应用坐标下降法（CD）。CD在每次迭代的方向上得到最小值，即

我们可以得到一个封闭的CD解决方案，由下面给出：

其中：

套索(Lasso)回归的代码如下所示：

def lassoRegression(self, x, y):if self.norm_type == "Standardization":x = preProcess.Standardization(x)else:x = preProcess.Normalization(x)y = np.expand_dims(y, axis=1)sample_num, feataure_dim = np.shape(x)w = np.ones([feataure_dim, 1])for i in range(self.iterations):for j in range(feataure_dim):h = np.dot(x[:, 0:j], w[0:j]) + np.dot(x[:, j+1:], w[j+1:])w[j] = np.dot(x[:, j], (y - h))if j == 0:w[j] = 0else:w[j] = self.softThreshold(w[j])return w

逐步线性回归

逐步线性回归类似于套索(Lasso)回归，它在每次迭代时应用贪婪算法以获得最小值而不是CD。逐步线性回归在每次迭代时增加或减少一小部分权重。逐步线性回归的代码如下所示：

def forwardstepRegression(self, x, y):if self.norm_type == "Standardization":x = preProcess.Standardization(x)else:x = preProcess.Normalization(x)sample_num, feature_dim = np.shape(x)w = np.zeros([self.iterations, feature_dim])best_w = np.zeros([feature_dim, 1])for i in range(self.iterations):min_error = np.inffor j in range(feature_dim):for sign in [-1, 1]:temp_w = best_wtemp_w[j] += sign * self.learning_ratey_hat = np.dot(x, temp_w)error = ((y - y_hat) ** 2).sum()           # MSEif error < min_error:                   # save the best parametersmin_error = errorbest_w = temp_ww = best_wreturn w

结论与分析

有许多解决方案可以获得线性回归的最优参数。在本文中，我们仅介绍一些基本算法。最后，让我们将线性回归与Sklearn中的线性回归进行比较，检测性能如下所示：

Sklearn线性回归性能：

我们的线性回归性能：

性能看起来很相似。

可以在MachineLearning中找到本文中的相关代码和数据集。

原文地址：https://www.codeproject.com/Articles/5061034/Step-by-Step-Guide-to-Implement-Machine-Learning-6

实现机器学习的循序渐进指南VIII——线性回归相关推荐

实现机器学习的循序渐进指南系列汇总
之前曾尝试翻译了机器学习中的KNN和决策树,最近这段时间陆续看到这个系列的相关文章,并尝试翻译分析.由于此系列文章直接相对零散,所以有了这篇简单的汇总文章,以帮助有兴趣的小伙伴迅速找到想看的文章. 具 ...
实现机器学习的循序渐进指南XII——Apriori
目录介绍 Apriori模型频繁项集关联规则结论与分析可访问实现机器学习的循序渐进指南系列汇总,获取本系列完成文章列表. 介绍 Apriori是一种学习频繁项集和关联规则的算法.Aprio ...
实现机器学习的循序渐进指南XI——DBSCAN
目录介绍 DBSCAN模型开始聚类算法参数估计结论与分析可访问实现机器学习的循序渐进指南系列汇总,获取本系列完成文章列表. 介绍基于密度的噪声应用空间聚类(DBSCAN)是一种基于密度 ...
实现机器学习的循序渐进指南X——KMeans
目录介绍 KMeans模型 KMEANS 平分KMeans KMEANS ++ 结论与分析可访问实现机器学习的循序渐进指南系列汇总,获取本系列完成文章列表. 介绍 KMeans是一种简单的聚类算 ...
实现机器学习的循序渐进指南IX ——树回归
目录介绍回归模型特征选择回归树的生成回归结论与分析可访问实现机器学习的循序渐进指南系列汇总,获取本系列完成文章列表. 介绍在现实世界中,一些关系不是线性的.因此,应用线性回归分析这些 ...
实现机器学习的循序渐进指南VII——Blending Stacking
目录介绍混合(Blending)模型混合(Blending)架构混合(Blending)实现混合(Blending)分类堆叠(Stacking)模型堆叠(Stacking)架构堆叠(S ...
实现机器学习的循序渐进指南VI——AdaBoost
目录介绍 AdaBoost模型弱分类器权重更新分类结论与分析可访问实现机器学习的循序渐进指南系列汇总,获取本系列完成文章列表. 介绍 AdaBoost是Boosting的一种方法,它基于 ...
实现机器学习的循序渐进指南V——支持向量机
目录介绍 SVM模型优化问题优化算法分类结论与分析可访问实现机器学习的循序渐进指南系列汇总,获取本系列完成文章列表. 介绍支持向量机(SVM)是一种基于特征空间最大边距的分类器.SVM ...
实现机器学习的循序渐进指南IV——逻辑回归
目录介绍逻辑回归模型参数估计优化算法分类结论与分析可访问实现机器学习的循序渐进指南系列汇总,获取本系列完成文章列表. 介绍逻辑回归是统计学习中的经典方法,它计算条件概率P(Y|X)并 ...

实现机器学习的循序渐进指南VIII——线性回归

介绍

回归模型

线性回归

局部加权线性回归

岭回归

套索(Lasso)回归

逐步线性回归

结论与分析

实现机器学习的循序渐进指南VIII——线性回归相关推荐

最新文章

热门文章