目录

  • 1. 概念
  • 2. 计算方法
  • 3. python 代码
  • 4. 举个例子
  • 5. sklearn 直接调用

转自:https://blog.csdn.net/qq_43403025/article/details/108285275

1. 概念

拟合优度(Goodness of Fit) 是指回归直线对观测值的拟合程度。度量拟合优度的统计量是可决系数(亦称确定系数)R²

  • R² 最大值为 1。R² 的值越接近1,说明回归直线对观测值的拟合程度越
  • 反之,R² 的值越,说明回归直线对观测值的拟合程度越

一般来说,拟合优度到达 0.8 以上就可以说拟合效果不错了。

2. 计算方法

3. python 代码

# #################################拟合优度R^2的计算######################################
def __sst(y_no_fitting):"""计算SST(total sum of squares) 总平方和:param y_no_predicted: List[int] or array[int] 待拟合的y:return: 总平方和SST"""y_mean = sum(y_no_fitting) / len(y_no_fitting)s_list =[(y - y_mean)**2 for y in y_no_fitting]sst = sum(s_list)return sstdef __ssr(y_fitting, y_no_fitting):"""计算SSR(regression sum of squares) 回归平方和:param y_fitting: List[int] or array[int]  拟合好的y值:param y_no_fitting: List[int] or array[int] 待拟合y值:return: 回归平方和SSR"""y_mean = sum(y_no_fitting) / len(y_no_fitting)s_list =[(y - y_mean)**2 for y in y_fitting]ssr = sum(s_list)return ssrdef __sse(y_fitting, y_no_fitting):"""计算SSE(error sum of squares) 残差平方和:param y_fitting: List[int] or array[int] 拟合好的y值:param y_no_fitting: List[int] or array[int] 待拟合y值:return: 残差平方和SSE"""s_list = [(y_fitting[i] - y_no_fitting[i])**2 for i in range(len(y_fitting))]sse = sum(s_list)return ssedef goodness_of_fit(y_fitting, y_no_fitting):"""计算拟合优度R^2:param y_fitting: List[int] or array[int] 拟合好的y值:param y_no_fitting: List[int] or array[int] 待拟合y值:return: 拟合优度R^2"""SSR = __ssr(y_fitting, y_no_fitting)SST = __sst(y_no_fitting)rr = SSR /SSTreturn rr

4. 举个例子

import numpy as np
import random
import matplotlib.pyplot as plt
# 生成待拟合数据
a = np.arange(10)
# 通过添加正态噪声,创造拟合好的数据
b = a + 0.4 * np.random.normal(size=len(a))
print("原始数据为: ", a)
print("拟合数据为: ", b)
rr = goodness_of_fit(b, a)
print("拟合优度为:", rr)
plt.plot(a, a, color="#72CD28", label='原始数据')
plt.plot(a, b, color="#EBBD43", label='拟合数据')
plt.legend()
plt.rcParams['font.sans-serif'] = ['SimHei']  # 用来正常显示中文标签
plt.rcParams['axes.unicode_minus'] = False  # 用来正常显示负号
plt.savefig(r"C:\Users\Yunger_Blue\Desktop\temp.jpg")
plt.show()

结果为:

原始数据为:  [0 1 2 3 4 5 6 7 8 9]
拟合数据为:  [0.23705933 1.20951491 2.37326542 3.00448608 3.48391211 4.30719527 5.95446175 7.50969723 8.97662945 8.27064816]
拟合优度为: 0.9971013400436336

5. sklearn 直接调用

from sklearn.linear_model import linearregression
lrmodel = linearregression()#regression 回归,衰退
lrmodel.fit(x, y)
lrmodel.score(x, y)#对模型进行评分

import pandas as pd
import matplotlib.pyplot as plt
from sklearn.linear_model import linearregression
#使用sklearn中集成的简单线性回归方程求解的方法,直接进行调用即可(1.导入求解类linerregression
#2.使用该类进行建模,得到lrmodel的模型变量)
lrmodel = linearregression()#regression 回归,衰退
#把自变量x和因变量y选择出来,以便进行模型训练
x = data[['广告投入']]
y = data[['销售额']]
#训练模型(即参数a和参数求解的过程)
lrmodel.fit(x, y)
#4.对回归模型进行检验
lrmodel.score(x, y)#对模型进行评分
#5.利用回归模型进行预测
lrmodel.predict([[50],[40],[30]])
#看参数a(截距)
alpha = lrmodel.intercept_[0]
#查看参数
beta = lrmodel.coef_[0][0]

参考资料
[1] 拟合优度R^2 2019.8
[2] 数学建模方法—【03】拟合优度的计算(python计算) 2020.8

python拟合优度R^2相关推荐

  1. python语言入门r_小结:jieba分词的Python与R语言基础用法介绍

    当前浏览器不支持播放音乐或语音,请在微信或其他浏览器中播放 人们说话不是一个词一个词崩出来的,文章也就由句子组成.要想让机器识别美文,体会中华名族汉语的博大精深,不是不可能.但是,首先需要将其转化成其 ...

  2. 搞机器学习,Python和R哪个更合适?

    [编者按]如果你正想构建一个机器学习项目,但却纠结于如何选择编程语言,这篇文章将是你所需要的.这篇文章不仅帮助你理解Python和R这两种语言的区别,还有助于你了解各个语言多方面的优势. 作者 | M ...

  3. Python超过R,成为数据科学和机器学习的首选语言!

    | 全文1765共字,建议阅读时长3分钟 | 近期,数据挖掘资讯网站KDnuggets开展了一项调查,问题是"2016年和2017年,在数据分析.数据科学和机器学习工作中,你使用 ...

  4. 为何python攀上数据科学巅峰?调查显示Python超越R

    根据KDnuggets 2017年最新调查,Python生态系统已经超过了R,成为了数据分析.数据科学与机器学习的第一大语言.本文对KDnuggets的此项调查结果做了介绍,并补充了一篇文章讲解为何P ...

  5. python和R对dataframe的单列数据进行统计:value_counts、table、unique、nunique、min、max、mean、sort、length、var、quantile、

    python和R对dataframe的单列数据进行统计:value_counts.table.unique.nunique.min.max.mean.sort.length.var.quantile. ...

  6. python和R对dataframe的分组聚合操作:dplyr、groupby、agg、group_by、nunique、reset_index、rename、summarise、n_distinct

    python和R对dataframe的分组聚合操作:dplyr.groupby.agg.group_by.nunique.reset_index.rename.summarise.n_distinct ...

  7. python和R对dataframe创建新的列或者改变列:dplyr、rename、map、mapvalues、astype、as.character、as.integer、as.numeric

    python和R对dataframe创建新的列或者改变列:dplyr.rename.map.mapvalues.astype.as.character.as.integer.as.numeric # ...

  8. python和R对dataframe进行连接、行过滤更新列内容:dplyr、merge、inner、left、right、inner_join、left_join、sort_values、loc

    python和R对dataframe进行连接.行过滤更新列内容:dplyr.merge.inner.left.right.inner_join.left_join.sort_values.loc.ar ...

  9. python和R对dataframe的拼接、采样、链式操作:dplyr、tidyr、concat、rbind、cbind、sample、sample_n、set.seed、mutate、filter

    python和R对dataframe的拼接.采样.链式操作:dplyr.tidyr.concat.rbind.cbind.sample.sample_n.set.seed.mutate.filter. ...

  10. python与R行列数据过滤(row column filtering):dplyr、 isnull、isna、drop、select、iloc、loc、isin、filter

    python与R行列数据过滤(row column filtering):dplyr. isnull.isna.drop.select.iloc.loc.isin.filter 很多工程师可能刚开始的 ...

最新文章

  1. postgresql 远程用户_liunx环境下安装PostgresSQL,开启远程连接
  2. php 读取php.ini,php7 读取php.ini[4]
  3. PHP内核探索:Zend引擎
  4. 程序设计语言编译原理_编译原理学习笔记(二):高级程序设计语言
  5. 谷歌Deep Bootstrap Framework:在线优化角度理解神经网络
  6. 面向对象——案例练习(3)判断两个立方体是否相等
  7. 打开windows 10系统语言设置的快捷方式
  8. linux网络唤醒,如何在Ubuntu Server 18.04中启用网络唤醒(WOL)
  9. MySQL innodb每行数据长度的限制
  10. c++ 线程池_JAVA并发编程:线程池ThreadPoolExecutor源码分析
  11. Android SQLite简单操作示例
  12. mysql ping 长连接超时时间_mysql_ping与mysql长连接(部分摘录) | 学步园
  13. HNOI2013 切糕
  14. 迷宫算法,求解所有路径(DFS),(bug找了好久 )
  15. 可视化讲解:什么是棒球游戏问题?
  16. 手机游戏公司设定的客户群体是大学生和农民工
  17. moveit缺少libfcl.so.0.6文件
  18. pmp-相关方权利/利益方格
  19. php activemq实例,php操作ActiveMQ - 小周博客,小周个人博客,程序猿小王子,技术博客,个人博客模板,php博客系统,设计模式,wzyl - 黑夜遮不住光亮...
  20. 如何将计算机管理中的可用空间,怎样增加电脑可用内存

热门文章

  1. Qt下汉字转拼音,包含二级汉字
  2. 基于Matlab高斯光束菲涅耳衍射的模拟
  3. 华为计算机网络技术试题,(完整版)华为试题答案
  4. 学习机器视觉需要掌握哪些知识?【转】
  5. 可编程并行接口芯片8255
  6. python爬虫四(cookie,代理池,模拟登录(打码))
  7. Http协议/JSON格式
  8. Matlab读nc文件
  9. 史上最简单的土地利用转移矩阵分析(附练习数据下载)
  10. 【leetcode刷题】[简单]427. 建立四叉树(construct quad tree)-java