近期在学习李宏毅老师的机器学习视频(https://www.bilibili.com/video/av10590361/?p=4),下面写一下自己的心得体会。

李老师用的是精灵宝可梦做的比喻,假设进化后的宝可梦的cp值(Combat Power)与未进化之前的宝可梦的cp值相关,我们想找出这两者之间的函数关系,可以设进化后的cp值为y,进化之前的cp值为x:y = b + w*x (不只可以设一次项,还可以设置二次项,三次项...,这个后面写)

我们的目的是将上述函数中b和w的值求出来,这里就引出了一个函数:loss function,如下图:

这个函数的意义是每个实际的数据和预测数据的差值平方求和,如下图:

由此我们可以想到,要想预测的函数贴合实际情况,那么我们的loss function必须求得最小值,(注:现在的w b是该函数的变量),现在变成了一道数学题,当 w, b取何值时,函数loss function求得最小值?这时候 我们就知道了要用到数学微积分的知识,两个参数,求偏微分都为0即可,但计算机是不能直接求出来这个数的,所以我们要将求偏微分为0的数学公式转化为计算机可以执行的方案,但思路不变。步骤是这样的,如图。

以w为例,随机取w=w0,如上图公式,当导数为负时,w0增大,导数为正,w0减小,不停进行迭代,最终停留在微分为0的点。n为学习速率,调整n的大小,可以改变迭代的次数。

问题:1、用更高次数的函数是可以的,因为他们是包含关系,但过高会出现过拟合现象

2、其实导数为0的情况也不一定是最小值(特殊情况,上面的图已经全部包含)

下面是计算这个函数的代码(python):

import numpy as np
import matplotlib.pyplot as plt
x_data = [338., 333., 328., 207., 226., 25., 179., 60., 208., 606.]
y_data = [640., 633., 619., 393., 428., 27., 193., 66., 226., 1591.]
# ydata = b + w * xdata
x = np.arange(-200, -100, 1) #bias
y = np.arange(-5, 5, 0.1) #weight
Z = np.zeros((len(x), len(y))) #建立一个len(x)*len(y)的零矩阵
print(Z)
# X, Y = np.meshgrid(x, y)
#计算loss function
for i in range(len(x)):for j in range(len(y)):b = x[i]w = y[j]Z[j][i] = 0for n in range(len(x_data)):Z[j][i] = Z[j][i] + (y_data[n] - b - w*x_data[n])**2Z[j][i] = Z[j][i] / len(x_data)# ydata = b + w * xdata
b = -120 # initital b
w = -4 # initial w
lr = 1 # learning rate
iteration = 100000# Store initial values for plotting
b_history = [b]
print(b_history)
w_history = [w]lr_b = 0
lr_w = 0# Iterations
for i in range(iteration):b_grad = 0w_grad = 0for n in range(len(x_data)):b_grad = b_grad - 2.0*(y_data[n] - b - w*x_data[n])*1.0w_grad = w_grad - 2.0*(y_data[n] - b - w*x_data[n])*x_data[n]lr_b = lr_b + b_grad**2lr_w = lr_w + w_grad**2# Update paramaters# adagrad,累加当前梯度平方和,学习速率再除以累加的根号b = b - lr/np.sqrt(lr_b) * b_gradw = w - lr/np.sqrt(lr_w) * w_grad# 初始版本,靠调lr改变图像#b = b - lr * b_grad#w = w - lr * w_grad#Store paramaters for plottingb_history.append(b)w_history.append(w)# plot the figure
plt.contourf(x, y, Z, 50, alpha=0.5, cmap=plt.get_cmap('jet'))
plt.plot([-188.4], [2.67], 'x', ms=12, markeredgewidth=3, color='orange')
plt.plot(b_history, w_history, 'o-', ms=3, lw=1.5, color='black')
plt.xlim(-200, -100)
plt.ylim(-5, 5)
plt.xlabel(r'$b$', fontsize=16)
plt.ylabel(r'$w$', fontsize=16)
plt.show()

欢迎大家关注我的公众号:codewangh

李宏毅机器学习课程--回归(Regression)相关推荐

  1. 李宏毅机器学习 之 回归Regression(二)

    目录 1.回归的定义 2.回归的例子 3.建模步骤 1)模型假设,选择模型框架(线性模型) 2)模型评估,如何判断众多模型的好坏(损失函数) 3)模型优化,如何筛选最优的模型(梯度下降) 4.步骤优化 ...

  2. 李宏毅机器学习课程---2、Regression - Case Study

    李宏毅机器学习课程---2.Regression - Case Study 一.总结 一句话总结: 分类讨论可能是比较好的找最佳函数的方法:如果 有这样的因素存在的话 模型不够好,可能是因素没有找全 ...

  3. 台大李宏毅机器学习课程

    [机器学习入门] 台大李宏毅机器学习课程,转载来自:https://blog.csdn.net/soulmeetliang/article/details/77461607 TOPIC CONTENT ...

  4. 李宏毅机器学习课程4~~~分类:概率生成模型

    分类问题用回归来解决? 当有右图所示的点时,这些点会大幅改变分类线的位置.这时候就会导致整体的回归结果变差.当把多分类当成回归问题,类别分别为1,2,3,4--,因为回归的问题是预测具体的值,这样定义 ...

  5. 李宏毅机器学习课程-Transfer Learning

    深度学习 -> 强化学习 ->迁移学习(杨强教授报告) 李宏毅机器学习课程-Transfer Learning 迁移学习-吴恩达 freeze 待处理的 理解深层神经网络中的迁移学习及Te ...

  6. 李宏毅机器学习课程12~~~半监督学习

    Semi-supervised Learning The distribution of the unlabeled data tell us something. Usually with some ...

  7. 【李宏毅机器学习】Logistic Regression 逻辑回归(p11) 学习笔记

    李宏毅机器学习学习笔记汇总 课程链接 文章目录 Logistic Regression Step 1: Function Set Step 2: Goodness of a Function Step ...

  8. 李宏毅2017机器学习课程 回归

    李宏毅2017机器学习课程 P3 回归 Regression 下文不区分w和ω( 文章目录 李宏毅2017机器学习课程 P3 回归 Regression 回归定义 举例:Pokemon精灵攻击力预测( ...

  9. AIstudio——李宏毅机器学习课程记录(一、机器学习介绍)

    什么是机器学习? 人工智慧(目标):简单的定义,就是让机器拥有学习的能力.而其中的机器学习,就是实现人工智慧的手段:深度学习,则是机器学习的其中一种方法. 对于一款智能产品(比如聊天机器人),假设采用 ...

最新文章

  1. 在windows下配置pthread多线程
  2. centos中的mysql安装配置,Linux下安装配置MySQL
  3. 武汉第二中学2021年高考成绩查询,武汉中学排名前十名,2021年武汉中学排名一览表...
  4. windows命令实验
  5. npm缺少css-loader,/style-compiler,stylus-loader问题,npm没有权限无法全局更新问题【已解决】
  6. LeetCode Algorithm 268. 丢失的数字
  7. NodeJS学习笔记—1.CommonJS规范
  8. JAVA——附加作业1——统计员工数
  9. http之content-type
  10. Jps介绍以及解决jps无法查看某个已经启动的java进程问题
  11. matlab中的yalmip工具箱 教程,yalmip工具箱及其教程。凸规划问题如何用yalmip工具箱优化?...
  12. MAC 青花瓷(Charles)爪机HTTPS 抓包
  13. Eclipse 官方简体中文语言包下载地址及安装方法
  14. amoeba启动报错
  15. javascript成神之路(1):如何编写高质量的js代码
  16. 通过宠物商店理解java面向对象
  17. python安装osgeo及shapefile库、is not a supported wheel on this platform 的问题
  18. 房价预测(基于决策树算法)
  19. Mac版docker安装
  20. 联想u盘装linux系统怎么安装步骤,联想电脑u盘安装系统步骤

热门文章

  1. 11.4.1 CURDATE()函数
  2. 2021年用于JavaScript开发的最佳IDE
  3. WebIDE 环境使用指南
  4. windows 下实现socket编程_传送文件
  5. 兰州大学计算机保护一志愿吗,注意!这些学校不太保护一志愿哦!
  6. ras私钥c#转java_Java与C#秘钥之间的转换
  7. php网站目录结构图,thinkPHP5.0站点目录结构-我心向阳
  8. Jmeter设置CSV Data Set Config,未读取文件中参数的原因
  9. 【嵌入式】MX283A开机
  10. server 2008 r2自建pptp服务器,增加外网端口