文章目录

  • 引入
  • 一、插值
    • 1.1 分段线性插值
    • 1.2 牛顿插值法
    • 1.3 拉格朗日插值多项式
    • 1.4 样条插值
      • 1.4.1 三次样条插值
    • 1.5 二维插值
      • 1.5.1 插值节点为网格节点
      • 1.5.2 插值节点为散乱节点
    • 1.6 例题
  • 二、拟合
    • 2.1 曲线拟合的线性最小二乘法
    • 2.2 多项式拟合
    • 2.3 指定函数拟合
  • 三、综合案例
  • 参考文章

引入

插值: 求过已知有限个数据点的近似函数。(强调这个近似函数要过所有已知点)
拟合: 已知有限个数据点,求近似函数,可不过已知数据点,只要求在某种意义下它在这些点上的总偏差最小。
插值和拟合都是要根据一组数据构造一个函数作为近似,由于近似的要求不同,二者的数学方法上是完全不同的。 而面对一个实际问题,究竟应该用插值还是拟合,有时容易确定,有时则并不明显。

一、插值

在工程和数学应用中,经常有这样一类数据处理问题,在平面上给定一组离散点列,要求一条曲线,把这些点按次序连接起来,称为插值

我们为什么要进行插值呢?
我们进行数据处理的理想,当然是希望数据非常的完备,啥玩意儿都有。但现实往往不尽如人意,数据经常会缺东少西的,那怎么办呢?

我们需要对一些不存在的数据进行一些插补。比如,我们分析某个餐馆在一段时间内的营收情况,但某一天收银系统出问题了,这天都是手工收款入账的,我们的系统里面就没有这一天的营收数据。那怎么办呢?我们就需要根据一定的办法把这天的营收数据给找补回来,那怎么找补呢?常用的方法有:

已知 n + 1 n+1 n+1 个点 ( x i , y i ) \left(x_{i}, y_{i}\right) (xi​,yi​) ( i = 0 , 1 , . . . , n ) (i=0,1,...,n) (i=0,1,...,n),下面求各种插值函数。

1.1 分段线性插值

简单地说,将每两个相邻的节点用直线连起来,如此形成的一条折线就是分段线性插值函数。计算 x x x点的插值时,只用到 x x x左右的两个节点,计算量与节点个数 n n n无关。但 n n n越大,分段越多,插值误差越小。
假设两个节点为 ( x 1 , y 1 ) ( x 2 , y 2 ) \left(x_{1}, y_{1}\right)\left(x_{2}, y_{2}\right) (x1​,y1​)(x2​,y2​),则该区间上的一次线性方程为:

其证明过程非常简单:


以上就是分段线性插值的原理,可以看出原理十分简单。分段线性插值运算量较小,插值误差较小,插值函数具有连续性,但是由于在已知点的斜率是不变的,所以导致插值结果不光滑,存在角点。

该方法可用matlab自带的interp1函数实现。

x = 0:10;  % 已知x值
y = x.*sin(x);  % 已知y值(表达式)
x1 = 0:0.25:10;   % 要求的插值点
y1 = interp1(x,y,x1);  % 用一维插值方法求出的值,默认method为linear
plot(x,y,'k*',x1,y1)

其运行的结果如下所示:

实际上用函数表作插值计算时,分段线性插值就足够了,如数学、物理中用的特殊函数表,数理统计中用的概率分布表等。

1.2 牛顿插值法

首先我们要知道牛顿多项式的形式: N n ( x ) = a 0 + a 1 ( x − x 0 ) + a 2 ( x − x 0 ) ( x − x 1 ) + ⋯ + a n ( x − x 0 ) ( x − x 1 ) ⋯ ( x − x n − 1 ) \mathrm{N}_{\mathrm{n}}(\mathrm{x})=\mathrm{a}_0+\mathrm{a}_1\left(\mathrm{x}-\mathrm{x}_0\right)+\mathrm{a}_2\left(\mathrm{x}-\mathrm{x}_0\right)\left(\mathrm{x}-\mathrm{x}_1\right)+\cdots+\mathrm{a}_{\mathrm{n}}\left(\mathrm{x}-\mathrm{x}_0\right)\left(\mathrm{x}-\mathrm{x}_1\right) \cdots\left(\mathrm{x}-\mathrm{x}_{\mathrm{n}-1}\right) Nn​(x)=a0​+a1​(x−x0​)+a2​(x−x0​)(x−x1​)+⋯+an​(x−x0​)(x−x1​)⋯(x−xn−1​)
其中 a k ( k = 0 , 1 , . . . , n ) a_k (k=0,1,...,n) ak​(k=0,1,...,n)为待定系数。

自变量之差与因变量之差之比叫差商

定义: 函数 y = f ( x ) \mathrm{y}=\mathrm{f}(\mathrm{x}) y=f(x) 在区间 [ x i , x i + 1 ] \left[\mathrm{x}_{\mathrm{i}}, \mathrm{x}_{\mathrm{i}+1}\right] [xi​,xi+1​] 上的平均变化率
f [ x i , x i + 1 ] = f ( x i + 1 ) − f ( x i ) x i + 1 − x i \mathrm{f}\left[\mathrm{x}_{\mathrm{i}}, \mathrm{x}_{\mathrm{i}+1}\right]=\frac{\mathrm{f}\left(\mathrm{x}_{\mathrm{i}+1}\right)-\mathrm{f}\left(\mathrm{x}_{\mathrm{i}}\right)}{\mathrm{x}_{\mathrm{i}+1}-\mathrm{x}_{\mathrm{i}}} f[xi​,xi+1​]=xi+1​−xi​f(xi+1​)−f(xi​)​
称为 f ( x ) f(x) f(x) 关于 x i , x i + 1 x_i, x_{i+1} xi​,xi+1​ 的一阶差商,并记为 f [ x i , x i + 1 ] f\left[x_i, x_{i+1}\right] f[xi​,xi+1​]

二阶差商
f [ x i , x i + 1 , x i + 2 ] = f [ x i + 1 , x i + 2 ] − f [ x i , x i + 1 ] x i + 2 − x i \mathrm{f}\left[\mathrm{x}_{\mathrm{i}}, \mathrm{x}_{\mathrm{i}+1}, \mathrm{x}_{\mathrm{i}+2}\right]=\frac{\mathrm{f}\left[\mathrm{x}_{\mathrm{i}+1}, \mathrm{x}_{\mathrm{i}+2}\right]-\mathrm{f}\left[\mathrm{x}_{\mathrm{i}}, \mathrm{x}_{\mathrm{i}+1}\right]}{\mathrm{x}_{\mathrm{i}+2}-\mathrm{x}_{\mathrm{i}}} f[xi​,xi+1​,xi+2​]=xi+2​−xi​f[xi+1​,xi+2​]−f[xi​,xi+1​]​
m \mathrm{m} m 阶差商
f [ x 0 , x 1 , ⋯ , x m ] = f [ x 1 , x 2 , ⋯ , x m ] − f [ x 0 , x 1 , ⋯ , x m − 1 ] x m − x 0 \mathrm{f}\left[\mathrm{x}_0, \mathrm{x}_1, \cdots, \mathrm{x}_{\mathrm{m}}\right]=\frac{\mathrm{f}\left[\mathrm{x}_1, \mathrm{x}_2, \cdots, \mathrm{x}_{\mathrm{m}}\right]-\mathrm{f}\left[\mathrm{x}_0, \mathrm{x}_1, \cdots, \mathrm{x}_{\mathrm{m}-1}\right]}{\mathrm{x}_{\mathrm{m}}-\mathrm{x}_0} f[x0​,x1​,⋯,xm​]=xm​−x0​f[x1​,x2​,⋯,xm​]−f[x0​,x1​,⋯,xm−1​]​

那么,牛顿插值公式为:

更多细节请参考:数值分析(一) 牛顿插值法及matlab代码

1.3 拉格朗日插值多项式

举个简单的例子,比如说,已知下面这几个点,我想找一根穿过它们的曲线:

我们可以合理的假设,这根曲线是一个二次多项式:

这是因为有三个已知的点,可以通过下列方程组解出这个二次多项式:

不过这里不打算通过解方程来得到这根二次曲线,如果已知的点有很多,那我们需要解的方程组会很复杂,因此我们来看看拉格朗日是怎么巧妙解出这根曲线的?

首先,第一根曲线 f 1 ( x ) f_1(x) f1​(x),在 x 1 x_1 x1​ 点处,取值为1,其余两点取值为0:

第二根曲线 f 2 ( x ) f_2(x) f2​(x),在 x 2 x_2 x2​ 点处,取值为1,其余两点取值为0:

第三根曲线 f 3 ( x ) f_3(x) f3​(x),在 x 3 x_3 x3​ 点处,取值为1,其余两点取值为0:

这三根曲线就是拉格朗日需要的,我们来看看为什么?

那么 f ( x ) = y 1 f 1 ( x ) + y 2 f 2 ( x ) + y 3 f 3 ( x ) f(x) = y_1f_1(x) + y_2f_2(x) + y_3f_3(x) f(x)=y1​f1​(x)+y2​f2​(x)+y3​f3​(x) 这个方程就可以经过已知的三个点。

就可以穿过这三个点,用一个动图直观理解下:

最终得到的曲线就是拉格朗日找到的曲线:

用严格的数学表达来理解拉格朗日插值法,过程如下:

拉格朗日(Lagrange)插值的基函数为: l i ( x ) = ( x − x 0 ) ⋯ ( x − x i − 1 ) ( x − x i + 1 ) ⋯ ( x − x n ) ( x i − x 0 ) ⋯ ( x i − x i − 1 ) ( x i − x i + 1 ) ⋯ ( x i − x n ) = ∏ j = 0 j ≠ i n x − x j x i − x j , i = 0 , 1 , ⋯ , n ∘ \begin{aligned} l_i(x) &=\frac{\left(x-x_0\right) \cdots\left(x-x_{i-1}\right)\left(x-x_{i+1}\right) \cdots\left(x-x_n\right)}{\left(x_i-x_0\right) \cdots\left(x_i-x_{i-1}\right)\left(x_i-x_{i+1}\right) \cdots\left(x_i-x_n\right)} \\ &=\prod_{\substack{j=0 \\ j \neq i}}^n \frac{x-x_j}{x_i-x_j}, i=0,1, \cdots, n_{\circ} \end{aligned} li​(x)​=(xi​−x0​)⋯(xi​−xi−1​)(xi​−xi+1​)⋯(xi​−xn​)(x−x0​)⋯(x−xi−1​)(x−xi+1​)⋯(x−xn​)​=j=0j=i​∏n​xi​−xj​x−xj​​,i=0,1,⋯,n∘​​
l i ( x ) l_{i}(x) li​(x)是 n n n次多项式,满足
l i ( x j ) = { 0 , j ≠ i 1 , j = i ∘ l_i\left(x_j\right)=\left\{\begin{array}{l} 0, j \neq i \\ 1, j=i_{\circ} \end{array}\right. li​(xj​)={0,j=i1,j=i∘​​
拉格朗日插值函数为:
L n ( x ) = ∑ i = 0 n y i l i ( x ) = ∑ i = 0 n y i ( ∏ j = 0 j ≠ i n x − x j x i − x j ) L_n(x)=\sum_{i=0}^n y_i l_i(x)=\sum_{i=0}^n y_i\left(\prod_{\substack{j=0 \\ j \neq i}}^n \frac{x-x_j}{x_i-x_j}\right) Ln​(x)=i=0∑n​yi​li​(x)=i=0∑n​yi​⎝ ⎛​j=0j=i​∏n​xi​−xj​x−xj​​⎠ ⎞​
我们可以将给定的 n + 1 n+1 n+1 个点带入拉格朗日基本多项式(插值基函数),发现当且仅当 i = j i=j i=j 时取1,其余情况取0,这样就保证了 L L L 经过这 n + 1 n+1 n+1 个点。

matlab代码如下:

function y0=Lagrange(x,y,x0)
n=length(x);
l=ones(1,n);
y0=0;
for j=1:nfor k=1:nif j~=k  % j≠k时l(j)=l(j)*(x0-x(k))/(x(j)-x(k));endend
end
for i=1:ny0=y0+l(i)*y(i);
end

1.4 样条插值

许多工程技术中提出的计算问题对插值函数的光滑性有较高要求,如飞机的机翼外形,内燃机的进、排气门的凸轮曲线,都要求曲线具有较高的光滑程度,不仅要连续,而且要有连续的曲率,这就导致了样条插值的产生。

样条(Spline) 本来是工程设计中使用的一种绘图工具,是富有弹性的细木条或细金属条。绘图员利用它把一些已知点连接成一条光滑曲线(称为样条曲线),并使连接点处有连续的曲率。三次样条插值就是由此抽象而来的。

简单来说,样条插值就是根据每两个相邻的数据点确定一段函数,然后再结合成一个函数,那么就是光滑的函数了。

数学上将具有一定光滑性的分段多项式称为样条函数。具体地说,给定区间[a,b]的一个分划:

如果函数 S ( x ) S(x) S(x) 满足:

1.4.1 三次样条插值

利用样条函数进行插值,即取插值函数为样条函数,称为样条插值。例如分段线性插值是一次样条插值。这里只介绍三次样条插值,即已知函数 y = f ( x ) y=f(x) y=f(x) 在区间 [ a , b ] [a,b] [a,b] 上的 n + 1 n+1 n+1 个节点 a = x 0 < x 1 < ⋯ < x n − 1 < x n = b a=x_0<x_1<\cdots<x_{n-1}<x_n=b a=x0​<x1​<⋯<xn−1​<xn​=b 上的值 y i = f ( x i ) ( i = 0 , 1... , n ) y_i = f(x_i) (i=0,1...,n) yi​=f(xi​)(i=0,1...,n) ,求插值函数 S ( x ) S(x) S(x) ,使得:


Matlab中三次样条插值有如下函数:

y = interp1(xdata,ydata,x,'spline');
y = spline(xdata,ydata,x);
pp = csape(x0,y0,conds); y = fnval(pp,x);
pp = csape(x0,y0,conds,valconds); y = fnval(pp,x);

pp = csape(x0,y0)使用默认的边界条件,即Lagrange边界条件。

pp = csape(x0,y0,conds,valconds)中的conds的指定插值的边界条件,其值可为:

  • ‘complete’ 边界为一阶导数,一阶导数的值在valconds参数中给出,若忽略valconds参数视为默认情况。
  • 'second’边界为二阶导数,二阶导数的值在参数valconds中给出,不使用参数valconds,默认值为[0,0]。

1.5 二维插值

前面讲述的都是一维插值,即节点为一维变量,插值函数是一元函数(曲线)。若节点是二维的,插值函数就是二元函数,即曲面。 如在某区域测量了若干点(节点)的高程(节点值),为了画出较精确的等高线图,就要先插入更多的点(插值点),计算这些点的高程(插值)。

1.5.1 插值节点为网格节点


Matlab中计算二维插值的命令如下:

z = interp2(x0,y0,z0,x,y,'method')

其中: x 0 x_0 x0​, y 0 y_0 y0​ 分别为 m m m 维和 n n n 维向量,表示节点; z 0 z_0 z0​为 n × m n×m n×m 矩阵,表示节点值; x x x, y y y 为一维数组,表示插值点, x x x与 y y y应是方向不同的向量,即一个是行向量,另一个是列向量; z z z为矩阵,它的行数为 y y y的维数,列数为 x x x的维数,表示得到的插值;'method’的用法同上面的一维插值。

【例】 测得平板表面3×5网格点处的温度分别为:

试作出平板表面温度分布曲面 z = f ( x , y ) z=f(x,y) z=f(x,y)的图形。

第一步:先在三维坐标画出原始数据,画出粗糙的温度分布曲面。

x=1:5;
y=1:3;
temps=[82 81 80 82 84;79 63 61 65 81;84 84 82 85 86];
mesh(x,y,temps)  % 构建空间曲面图(mesh画的是曲线网格图,surf画的是曲面网格图)

第二步:以平滑数据,在x、y方向上每隔0.2个单位的地方进行插值。

xi=1:0.2:5;
yi=1:0.2:3;
zi=interp2(x,y,temps,xi',yi,'cubic');  % 注意这里x和y形状不一样,任意一个作为行向量,另一个作为列向量
mesh(xi,yi,zi)


contour(xi,yi,zi,20,'r')作其等高线图(等高线图:z值一样的点连起来的图)如下:


如果是三次样条插值,可以使用命令:

pp = csape({x0,y0},z0,conds,valconds);
z = fnval(pp,{x,y});

其中: x 0 x_0 x0​, y 0 y_0 y0​ 分别为 m m m 维和 n n n 维向量; z 0 z_0 z0​为 m × n m×n m×n 矩阵; z z z为矩阵,它的行数为 x x x的维数,列数为 y y y的维数,表示得到的插值,具体使用方法同一维插值。

1.5.2 插值节点为散乱节点


注意此时已知的是n个节点,和1.5.1的m×n个节点情况不同。

对上述问题,Matlab中提供了插值函数griddata,其格式为:

ZI = griddata(x,y,z,XI,YI);

【例】 在某海域测得一些点 ( x , y ) (x,y) (x,y)处的水深z由下表给出,船的吃水深度为5英尺,在矩形区域 ( 75 , 200 ) × ( − 50 , 150 ) (75,200) ×(-50,150) (75,200)×(−50,150) 里的哪些地方船要避免进入。在矩形区域内画出海底曲面的图形。

由题意得,船的吃水深度小于5米时,船比较容易搁浅。

x=[129 140 103.5 88 185.5 195 105 157.5 107.5 77 81 162 162 117.5];
y=[7.5 141.5 23 147 22.5 137.5 85.5 -6.5 -81 3 56.5 -66.5 84 -33.5];
z=[-4 -8 -6 -8 -6 -8 -8 -9 -9 -8 -8 -9 -4 -9];
cx=75:0.5:200;  % 矩形区域
cy=-50:0.5:150;
cz=griddata(x,y,z,cx,cy','cubic');  % 采用立方插值在矩形区域内做二维插值
figure(1),meshz(cx,cy,cz);  % 海底曲线图
xlabel('X'),ylabel('Y'),zlabel('Z');

figure(2),contour(cx,cy,cz,[-5 -5],'r');  % 画出深度为5米的等高线,则在等高线内部的深度均小于5米
grid;
hold on;
plot(x,y,'+');  % 二维坐标中标出数据各个点位置
xlabel('X'),ylabel('Y');


红色曲线内部的点都是船比较容易搁浅的位置。

1.6 例题

【例】机床加工。 待加工零件的外形根据工艺要求由一组数据 ( x , y ) (x,y) (x,y) 给出(在平面情况下),用程控铣床加工时每一刀只能沿 x x x 方向和 y y y 方向走非常小的一步,这就需要从已知数据得到加工所要求的步长很小的 ( x , y ) (x,y) (x,y) 坐标。
表5.1中给出的 x , y x,y x,y 数据位于机翼断面的下轮廓线上,假设需要得到 x x x 坐标每改变0.1时的 y y y 坐标。试完成加工所需数据,画出曲线,要求用最近项插值、分段线性插值和三次样条插值(不同边界)方法计算。

Matlab代码如下:

x0=[0 3 5 7 9 11 12 13 14 15];
y0=[0 1.2 1.7 2.0 2.1 2.0 1.8 1.2 1.0 1.6];
x=0:0.1:15;
% ------最近项插值
y1 = interp1(x0,y0,x,'nearest');
subplot(1,5,1)
plot(x0,y0,'+',x,y1);
title('nearest method');
% ------ 线性插值
y2 = interp1(x0,y0,x);
subplot(1,5,2)
plot(x0,y0,'+',x,y2);
title('Piecewise linear');
% ------立方样条插值
y3 = interp1(x0,y0,x,'spline');
subplot(1,5,3)
plot(x0,y0,'+',x,y3)
title('Splinel')
% ------三次样条插值的Lagrange边界条件
pp1 = csape(x0,y0);
y4 = fnval(pp1,x);
subplot(1,5,4)
plot(x0,y0,'+',x,y4)
title('Spline2')
% ------指定插值边界条件为二阶导数
pp2 = csape(x0,y0,'second');
y5 = fnval(pp2,x);  % 使用fnval函数求插值点的函数值
subplot(1,5,5)
plot(x0,y0,'+',x,y5);
title('Spline3')

其运行结果为:

我们可以明显感觉到,三次样条插值得到的曲线会更加平滑。

【例】 在某山区测得一些地点的高程如下表。平面区域为 1200 ≤ x ≤ 4000 , 1200 ≤ y < 3600 1200≤x≤4000, 1200≤y<3600 1200≤x≤4000,1200≤y<3600,试用Matlab中的最邻近插值、双线性插值和双三次插值3种方法作出该山区的地貌图和等高线图,并求出最高和最低点,并对几种插值方法进行比较。

首先,第一步我们做出已知点的网格面。

x=1200:400:4000;
y=1200:400:3600;
[xx,yy]=meshgrid(x,y);  % xx是以x为行(列数为向量x的长度)的矩阵,yy是以y为列(行数为y的长度)的矩阵。[xx,yy]矩阵x和矩阵y合在一起
z=[1130 1250 1280 1230 1040 900 500 700; 1320 1450 1420 1400 1300 700 900 850; 1390 1500 1500 1400 900 1100 1060 950; 1500 1200 1100 1350 1450 1200 1150 1010;1500 1200 1100 1550 1600 1550 1380 1070; 1500 1550 1600 1550 1600 1600 1600 1550; 1480 1500 1550 1510 1430 1300 1200 980];
figure(1);
meshz(x,y,z)
xlabel('X'),ylabel('Y'),zlabel('Z')
title('网格面')


然后,我们用最邻近插值法看一下插值结果:

xi=1200:40:4000;
yi=1200:40:3600;
figure(2)
z1i=interp2(x,y,z,xi,yi','nearest');
subplot(1,2,1),surfc(xi,yi,z1i),xlabel('X'),ylabel('Y'),zlabel('Z'),title('最邻近插值');
subplot(1,2,2),contour(xi,yi,z1i,10,'r'),title('最邻近插值等高线图');


同样,看一下线性插值法及其等高线图。

figure(3)
z2i=interp2(x,y,z,xi,yi','linear');
subplot(1,2,1),surfc(xi,yi,z2i),xlabel('X'),ylabel('Y'),zlabel('Z'),title('线性插值');
subplot(1,2,2),contour(xi,yi,z2i,10,'r'),title('线性插值等高线图');


立方插值法及其等高线图:

figure(4)
z3i=interp2(x,y,z,xi,yi','cubic');
subplot(1,2,1),surfc(xi,yi,z3i),xlabel('X'),ylabel('Y'),zlabel('Z'),title('立方插值');
subplot(1,2,2),contour(xi,yi,z3i,10,'r'),title('立方插值等高线图');


三次样条插值法及等高线图:

figure(5)
z4i=interp2(x,y,z,xi,yi','spline');
subplot(1,2,1),surfc(xi,yi,z4i),xlabel('X'),ylabel('Y'),zlabel('Z'),title('三次样条插值');
subplot(1,2,2),contour(xi,yi,z4i,10,'r'),title('三次样条插值等高线图');


分段线性插值法及其等高线图:

figure(6)
z5i=interp2(x,y,z,xi,yi');
subplot(1,2,1),surfc(xi,yi,z5i),xlabel('X'),ylabel('Y'),zlabel('Z'),title('分段线性插值');
subplot(1,2,2),contour(xi,yi,z5i,10,'r'),title('分段线性插值等高线图');

比较由以上五种插值方法得到的地貌图和等高线图,可以看出:

  • 由于两个高度之间直线为最短距离,因此利用最邻近插值得到的地貌图和等高线为直线,描述的山地地貌皆为陡崖,对于一般山区的地貌是不符合的;
  • 分段线性插值得到的图像随着分段数目的增多,而更加平缓,棱角更加不明显。
  • 利用线性插值、三次样条插值和立方插值所得到的图像较为平滑,更加适合描述该山地的地貌。

二、拟合

2.1 曲线拟合的线性最小二乘法


原则上不需要经过图像中的任何一个点,只要保证与各点的距离总体足够小即可。

线性最小二乘法是解决曲线拟合最常用的方法,其基本思路是,令

拟合的准则是使 y i y_i yi​ 与 f ( x i ) f(x_i) f(xi​) 的距离的平方和最小,称为最小二乘法。

那么,系数 a k a_k ak​该怎么确定呢?这里参考了《数学建模算法与应用》的证明过程。
1)系数 a k a_k ak​的确定


2)函数 r k ( x ) r_k(x) rk​(x)的选取
面对一组数据 ( x i , y i ) (x_i,y_i) (xi​,yi​), i = 1 , 2 , . . . , n i=1 ,2,...,n i=1,2,...,n,用线性最小二乘法作曲线拟合时,首要的也是关键的一步是恰当地选取 r 1 ( x ) , . . , r m ( x ) r_1(x),..,r_m (x) r1​(x),..,rm​(x) 。如果通过机理分析,能够知道y与x之间的函数关系, 则 r 1 ( x ) , . . , r m ( x ) r_1(x),..,r_m (x) r1​(x),..,rm​(x) 容易确定。若无法知道 y y y 与 x x x 之间的关系,通常可以将数据 ( x i , y i ) (x_i,y_i) (xi​,yi​), i = 1 , 2 , . . . , n i=1 ,2,...,n i=1,2,...,n 作图,直观地判断应该用什么样的曲线去作拟合。常用的曲线有如下:

已知一组数据,用什么样的曲线拟合最好,可以在直观判断的基础上,选几种曲线分
别拟合,然后比较,看哪条曲线的最小二乘指标 J J J 最小。

在Matlab中,线性最小二乘法的标准型为:

【例】 用最小二乘法求一个形如 y = a + b x 2 y=a+bx^2 y=a+bx2 的经验公式,拟合下表中的数据。

X=[19 25 31 38 44]';
Y=[19.0 32.3 49.0 73.3 97.8]';
R=[ones(5,1),x.^2]

我们看一下这里R的值,进一步理解上文推导过程中的含义:

用Matlab标准型的命令求系数:

ab=R\Y

求得的结果如下:

意味着,求得的拟合公式为: y = 0.9726 + 0.05 x 2 y=0.9726 + 0.05x^2 y=0.9726+0.05x2。

我们来看一下该曲线的拟合效果如何?

x0=19:0.1:44;
y0=ab(1)+ab(2)*x0.^2;
plot(X,Y,'o',x0,y0,'r')


注:这里可以联想到GM(1,1)模型中用到了最小二乘法。

2.2 多项式拟合

如果取

即用 m m m 次多项式拟合给定数据,MatLab中有现成的函数a=polyfit(x0,y0,m)
其中,输入参数 x 0 、 y 0 x_0、y_0 x0​、y0​ 为要拟合的数据; m m m 为拟合多项式的次数。输出参数 a a a 为拟合多项式的系数向量。

【例】 某乡镇企业1990年—1996年的生产利润如表所列。

试预测1997年和1998年的利润。

思路如下:
首先第一步我们可以作已知数据的散点图,直观判断其需要什么样的多项式拟合。

x0=[1990  1991  1992  1993  1994  1995  1996];
y0=[70   122   144   152   174   196   202];
plot(x0,y0,'*')


我们可以发现,该乡镇企业的年生产利润几乎直线上升。因此,可以用 y = a 1 x + a 0 y=a_1x+a_0 y=a1​x+a0​ 作为拟合函数来预测该乡镇企业未来的年利润。代码如下:

x0=[1990  1991  1992  1993  1994  1995  1996];
y0=[70   122   144   152   174   196   202];
a=polyfit(x0,y0,1)
y97=polyval(a,1997)
y98=polyval(a,1998)

最终求得的结果为:(注意,次数高的项在前面)

2.3 指定函数拟合

fittype是自定义拟合函数,cfun=fit(x,y,f)。拟合数据 x 、 y x、y x、y 必须为列向量。

假设原始数据散点图如下所示:

我们可以编写一个m文件来实现自定义拟合函数。

 syms tx = [0;0.4;1.2;2;2.8;3.6;4.4;5.2;6;7.2;8;9.2;10.4;11.6;12.4;13.6;14.4;15];y = [1;0.85;0.29;-0.27;-0.53;-0.4;-0.12;0.17;0.28;0.15;-0.03;-0.15;-0.071;0.059;0.08;0.032;-0.015;-0.02];f = fittype('a*cos(k*t)*exp(w*t)','independent','t','coefficients',{'a','k','w'});cfun = fit(x,y,f)    %显示拟合函数xi = 0:.1:20;yi = cfun(xi);plot(x,y,'r*',xi,yi,'b-');


求出来系数 a 、 k 、 w a、k、w a、k、w 的值分别为:

三、综合案例


先挖一个坑在这,有空再来写。

参考文章

[1] 插值算法——分段线性插值(1)
[2] 如何直观地理解拉格朗日插值法?(知乎)
[3] 数值分析(一) 牛顿插值法及matlab代码
[4] 数值分析(二) 三次样条插值法matlab程序
[5] 数学建模学习-插值法
[6] 数学建模——拟合

数学建模十大算法02—插值与拟合(拉格朗日插值、三次样条插值、线性最小二乘法……)相关推荐

  1. 数学建模_数学模型的分类数学建模十大算法

    数学模型的分类 数学建模十大算法 1.蒙特卡罗算法 (该算法又称随机性模拟算法, 是通过计算机仿真来解决问题的算法, 同时可以 通过模拟可以来检验自己模型的正确性,比较好用的算法) 2.数据拟合.参数 ...

  2. 数学建模十大算法(收藏)

    1.蒙特卡罗算法(该算法又称随机性模拟算法,是通过计算机仿真来解决问题的算法,同时可以通过模拟可以来检验自己模型的正确性,是比赛时必用的方法) 2.数据拟合.参数估计.插值等数据处理算法(比赛中通常会 ...

  3. 数学建模十大算法04—图论算法(最短路径、最小生成树、最大流问题、二分图)

    文章目录 一.最短路径问题 1.1 两个指定顶点之间的最短路径 1.1.1 Dijkstra算法 1.1.2 Matlab函数 1.2 每对顶点之间的最短路径 1.2.1 Dijkstra算法 1.2 ...

  4. 插值与拟合 (二) : 曲线拟合的线性最小二乘法

    目录 1  线性最小二乘法 最小二乘准则                           系数   的确定 1.2  函数  的选取 常用的拟合曲线:直线.多项式曲线.双曲线.指数曲线 2 最小二 ...

  5. 神经网络十大算法有哪些,神经网络十大算法排名

    数学建模的十大算法 . 1.蒙特卡罗算法(该算法又称随机性模拟算法,是通过计算机仿真来解决问题的算法,同时可以通过模拟可以来检验自己模型的正确性,是比赛时必用的方法)2.数据拟合.参数估计.插值等数据 ...

  6. 数学建模中常用的十大算法

    数学建模中常用的十大算法 这里,我们将对数学建模中常用的十大算法做一个简单的梳理,并给出一些可以继续学习的参考Blogs 文章目录 数学建模中常用的十大算法 1.蒙特卡罗算法 2.数据拟合.参数估计. ...

  7. 统治世界的十大算法(转)

    原文:http://www.ctocio.com/ccnews/15714.html 软件正在吃掉世界,而软件的核心则是算法.算法千千万万,又有哪些算法属于"皇冠上的珍珠"呢?Ma ...

  8. [算法] 当今世界最为经典的十大算法--投票进行时

    当今世界最为经典的十大算法--投票进行时 ---------------------------------------- 第一部分.来自圣经的十大算法 第十名:Huffman coding(霍夫曼编 ...

  9. 真正统治世界的十大算法(转)

    不久前的某一天,我在浏览Reddit发现了一篇有趣的文章<统治世界的十大算法>,作者George Dvorsky在那篇文章中试图解释算法之于当今世界的重要性,以及哪些算法对人类文明最为重要 ...

最新文章

  1. 关注这些技术号,你将拥有半个互联网圈
  2. 每日一皮:强大的sudo ...
  3. pytorch tensor查找0_在PyTorch中Tensor的查找和筛选例子
  4. URAL-1982 Electrification Plan 最小生成树
  5. 将ubuntu配置为路由器_“名酒为王”时代来临但资源将尽,看泸州老窖如何进行“名酒资源再配置”丨深度观察...
  6. 广告冷启动_超级推荐如何缩短冷启动时间,让流量快速注入店铺
  7. Realme首款5G手机真我X50官宣:支持SA/NSA双模5G
  8. Meta Learning | 加了元学习之后,少样本学习竟然可以变得这么简单!
  9. sqlmap无法使用-r、-l命令问题原因没有携带请求参数即注入点
  10. 精读CSS权威指南第四版(1)
  11. Unity_AR制作_80
  12. 剑指offer-20200226
  13. Apache Hudi调研小记
  14. 美国如果把根域名服务器封了,中国会从网络上消失?
  15. 市内移出版本2.0(1、一页显示15条。2、增加控制标志。3、打印表格时绑定的list的优化。4、保存迁出登记信息时根据业务流水号判断增加还是修改。5、统一管理常量)
  16. Android计步器获取手机步数
  17. QGis 使用高德 画KML
  18. htmlUnit的读取js渲染的页面
  19. 轨道六根数的含义汇总
  20. php连接mysql指定表名_php mysql获取指定数据库所有表名_PHP教程

热门文章

  1. 小米3和BlackBerry Z3“撞衫了”!
  2. 硕士面试公司程序员,却不被招聘方认可?面试官:这学历真没价值
  3. wincc冗余服务器系统授权选择,两台服务器wincc冗余需要装哪些授权?
  4. Hadoop生态系统主要架构
  5. Hadoop的生态系统介绍
  6. 抢夺英特尔Mac订单 AMD拦路虎暂不成气候
  7. 密码学实验6 维吉尼亚密码
  8. C. Dominated Subarray----------思维
  9. html中colgroup标签,HTML colgroup 标签
  10. Maven工程下,解决配置文件相关的File doesn't exits,以及xxxMapper.xml doesn't exits