本发明涉及一种基于多项式拟和的野值剔除方法,适用于通信、 导航等测控系统领域。

背景技术:

在通信、导航等测量数据中往往包含了大量的严重偏离被测量真 值的数据点,这些异常数据就称为野值。尽管野值数量较少,但对数 据的处理和分析会产生较大的影响,降低了数据的可靠性。虽然有些 滤波平滑方法能够在一定程度上剔除野值,但是当参数选择不好的 话,很可能使数据处理结果因为失真太严重而没有说服力,或者达不 到平滑的效果。因此,在数据的平滑处理之前,应先将测量数据中的 野值点进行有效的辨识和剔除。对试验数据中野值的识别剔除,有人 工和计算机自动两种方式。人工方式对有明显错误的异常值的判断比 较成功,但是这种方式效率很低,标准难以掌握,特别是对数据量较 大时候,这种缺点尤为明显。

技术实现要素:

为了克服上述现有技术的不足之处,本发明提供一种基于多项式 拟和的野值剔除方法,以多项式拟和为基础,发明计算机自动去除测 量数据中的野值的方法,通过拟合估计值与观测值的残差序列识别及 剔除观测数据序列中的野值,对实际工程应用的重要的应用价值。

为实现上述目的,本发明采用如下技术方案:一种基于多项式拟 和的野值剔除方法,包括步骤:

1、对原测量数据进行n阶多项式拟和,得出系数矩阵和拟和多 项式,由已知的观测数据i画出粗略的散点图,选取合适的次数n进 行最小二乘多项式拟和,对给定的测量数据(xi,yi)构造一个函数p(x) 作为给定数据(xi,yi)的近似表达式,使误差ri=p(xi)-yi的平方和最小, 即其中i为0到m的整数,

从几何意义上寻求与给定点(xi,yi)的距离平方和为最小的曲线 y=p(x),函数p(x)为拟合函数或最小二乘解,求拟合函数p(x)的方法 为曲线拟合的最小二乘法,当拟合函数为多项式时,即当 (n≦m)时,为最小二乘拟合多项式,

为a0,a1,...,an的多元函数,对I=I(a0,a1,...,an) 求极值,由多元函数求极值的必要条件, 即 即是关于a0,a1,...,an的线性方 程,用矩阵表示为

该式为对原测量数据进行n阶多项式拟和,得出系数矩阵 a0,a1,...,an,可得到拟和多项式求出对应的拟合值序列 和对应的残差序列;

2、计算出相应的拟合值序列为{pi:i=1,2,...,m}:生成拟合残差序 列为{Δyi=pi-yi,i=1,2,...m};

3、计算拟合残差序列的均方误差σ,按如下公式进行计算:

4、利用工程上常用的3σ准则判断并剔除野值,剔除野值后的 数据为yi':i=1,2,...,m

根据该公式进行判定,若残差值小于门限值,则该点为正常值, 此值不变;若残差值大于或等于门限值时,则判断该点为野值,用该 点前六个点的均值代替该值;

5、判断是否对所有数据都进行了处理,若没有处理完毕,则 对没处理的数据重新进行野值点判断;

6、对全部数据进行野值判断后,输出剔除野值后的数据。

在上述技术方案中,所述门限值3σ可根据实验具体情况作 出适当的修改。

本发明的有益效果是:本发明以多项式拟和为基础,通过拟合估 计值与观测值的残差序列识别及剔除观测数据序列中的野值,对实际 工程应用的重要的应用价值;与现有方法相比,不依赖设计经验,因 此更方便;门限值3σ可根据实验具体情况做出适当的更改,因此设 计出的参数更准确,应用范围更广;野值剔除后补值的方式保持了数 据的连续性,满足数据处理选点的要求,实现了对数据源的初级滤波。

附图说明

图1为本发明的步骤流程图。

图2为源测量数据的分布图。

图3为图2进行n阶多项式后的拟和曲线图。

图4为残差数列图。

图5为剔除野值后的数据图。

具体实施方式

下面结合附图及具体实施例对本发明作进一步说明。

如图1所示一种基于多项式拟和的野值剔除方法,包括步骤:

步骤一:对原测量数据据进行n阶多项式拟合,得出系数矩阵和 拟和多项式;

由已知的观测数据(i=0,1,…,m)画出粗略的图形——散点 图,选取合适的次数n进行最小二乘多项式拟合;

对给定的测量数据(xi,yi)(i=0,1,…,m),构造一个函数p(x)作 为给定数据(xi,yi)的近似表达式,使误差ri=p(xi)-yi(i=0,1,…,m)的 平方和最小,即

从几何意义上寻求与给定点(xi,yi)(i=0,1,…,m)的距离平方和为最 小的曲线y=p(x)。函数p(x)称为拟合函数或最小二乘解,求拟合函数 p(x)的方法称为曲线拟合的最小二乘法。当拟合函数为多项式时,即 当时,称为最小二乘拟合多项式。显然

为a0,a1,...,an的多元函数,因此上述问题即为求I=I(a0,a1,...,an)的极值问 题。由多元函数求极值的必要条件,得

式(4)是关于a0,a1,...,an的线性方程组,用矩阵表示为

公式(5)为对原测量数据据进行n阶多项式拟合,得出系数矩阵。 求出系数矩阵a0,a1,...,an,得到拟合多项式:

步骤二、求出对应的拟合值序列和对应的残差序列;

计算出相应的拟合值序列为{pi:i=1,2,...,m}:生成拟合残差序列 为{Δyi=pi-yi,i=1,2,...m};

步骤三、计算均方误差

计算拟合残差序列的均方误差σ按如下公式进行计算:

步骤四、对野值点进行判断

利用工程上常用的3σ准则判断并剔除野值,剔除野值后的数据 为{yi':i=1,2,...,m}

根据公式(8)进行判定,若残差值小于门限值,为正常值,此值 不变;若大于或等于门限值,则判断为野值。若该点是野值,则该点 用前6个点的均值代替,若该点不是野值,则该点的值不变。

步骤五:判断是否对所有数据都进行了处理,若没有处理完毕,则对 没处理的数据重新进行野值点判断;

步骤六:若已经对所有数据都进行了野值判断,则输出剔除野值 后的数据。整个流程结束。

在上述技术方案中,所述门限值3σ可根据实验具体情况作出适 当的修改。

在第步骤一中,对原测量数据据进行n阶多项式拟合,得出系数 矩阵和拟和多项式;步骤二中求出对应的拟合值序列和对应的残差序 列;步骤三中计算均方误差;步骤四中采用3σ准则判断并剔除野值; 步骤五中对测试数据进行判断,判断是否对所有数据都进行了处理, 若没有处理完毕,则对没处理的数据重新进行野值点判断;步骤六中 输出剔除野值后的数据,流程结束。该方法流程可以用于计算机自动 判别。

以实际测量的海流速度大小数据为例,从中选取800个连续的数 据点进行剔除野值处理。原测量数据如图2所示,进行n阶多项式拟 和后拟和曲线如图3所示,残差序列如图4所示,输出剔除野值后的 数据如图5所示。

本发明以多项式拟和为基础,通过拟合估计值与观测值的残差序 列识别及剔除观测数据序列中的野值,对实际工程应用的重要的应用 价值;与现有方法相比,不依赖设计经验,因此更方便;门限值3σ 可根据实验具体情况做出适当的更改,因此设计出的参数更准确,应 用范围更广;野值剔除后补值的方式保持了数据的连续性,满足数据 处理选点的要求,实现了对数据源的初级滤波。

以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范 围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技 术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围 之内。

matlab 野值剔除,一种基于多项式拟和的野值剔除方法与流程相关推荐

  1. matlab计算潮差程序,一种基于FVCOM模型的可视化潮汐潮流预报方法与流程

    本发明涉及潮汐预报技术领域,特别是涉及一种基于FVCOM模型的可视化潮汐潮流预报方法. 背景技术: 潮汐预报对一定海区在未来一定时间内的潮汐涨落情况进行的推算和预报.预报内容包括逐日的高潮和低潮高度及 ...

  2. matlab 零速检测,一种基于车辆零速检测的惯性导航误差修正方法与流程

    本发明涉及车载导航与定位领域,尤其是涉及一种基于车辆零速检测的惯性导航误差修正方法. 背景技术: 惯性导航系统(inertialnavigationsystem,ins)能根据惯性传感器(陀螺仪.加速 ...

  3. matlab模式识别提取特征向量,一种基于小波特征向量提取的手机检测方法与流程...

    本发明涉及到手机检测领域,尤其涉及到一种基于小波特征向量提取的手机检测方法. 背景技术: 随着保密要求的不断提高,很多场合严禁携带手机.录音笔.录像机等电子产品,亟需一种设备可以检测出该类电子产品.目 ...

  4. matlab血糖预测,一种基于VMD-PACF-BP模型的动态血糖在线预测方法与流程

    本发明属于血糖预测技术领域,尤其涉及一种基于VMD-PACF-BP模型的动态血糖在线预测方法. 背景技术: 目前,中国患有糖尿病人数已成为在世界上拥有糖尿病患者最多的国家.为了降低糖尿病患者长期处于高 ...

  5. 皮肤范围检测matlab思路,一种基于S21相位的无创血糖浓度检测方法与流程

    本发明属于微波无创血糖检测技术领域,涉及血糖浓度的检测评估. 背景技术: 社会经济不断发展,随之而来的快速的生活节奏.不健康的饮食习惯.久坐缺乏适当运动的生活方式等都增加了糖尿病的发病率.糖尿病作为一 ...

  6. matlab识别中国象棋棋盘,一种基于图像处理的中国象棋识别系统及方法与流程

    本发明涉及计算机图像识别技术,具体涉及一种基于图像处理的中国象棋识别系统及方法. 背景技术: 数字图像处理技术在机器感知领域应用十分广泛,主要目标是通过一些图像处理技术从图像中提取信息,该信息类似于人 ...

  7. 湍流退化图像复原如何使用matlab,一种基于相关最大性的湍流退化图像复原方法与流程...

    本发明涉及退化图像复原方法,特别涉及一种大气湍流图像复原问题,属于多帧湍流图像复原领域. 背景技术: 在中远距离成像系统中,由于风速.温度等影响造成的大气湍流现象,使得传播介质折射率不规则变化,导致光 ...

  8. matlab plv,一种基于微状态的脑功能网络构建方法与流程

    本发明涉及脑功能网络研究技术领域,更具体而言,涉及一种基于微状态的脑功能网络构建方法. 背景技术: 复杂网络作为近年来一种新兴的数据分析方法,被应用于各个方面.由于大脑是一个十分复杂的系统,不同神经元 ...

  9. 极坐标梯度公式_一种基于极坐标系梯度变化的类圆环边缘检测方法与流程

    本发明涉及图形处理技术领域,具体地说是一种基于极坐标系梯度变化的类圆环边缘检测方法. 背景技术: 边缘检测是图像处理和计算机视觉中的基本问题,边缘检测的目的是标识数字图像中亮度变化明显的点.图像属性中 ...

最新文章

  1. c++软件开发面试旋极面试题_经典软件开发面试题:浏览器中输入一个网址后发生了什么?...
  2. Android CoordinatorLayout使用
  3. js返回上一页与前进下一页
  4. MyBatis的association示例
  5. 动态决定viewarea应该加载哪个view
  6. Java编程字符逆序输出_用JAVA编写一程序:从键盘输入多个字符串到程序中,并将它们按逆序输出在屏幕上。...
  7. AssertJ断言系列一
  8. 蓝桥杯vip答案java_Java实现 蓝桥杯VIP 算法训练 寂寞的数
  9. C语言多线程基础-01-线程的创建与销毁
  10. 转置矩阵,矩阵的行列式,伴随矩阵,逆矩阵的概念及C#求解
  11. jle汇编_汇编跳转指令集
  12. 针对在校大学生的C语言入门学习——高级语法
  13. 在线作图丨微生物分析——alpha多样性指数分析
  14. UltraEdit+Masm--打造自己的汇编IDE
  15. scau 10306 Prison break
  16. 双连通分量的题目列表(一)
  17. MFC制作Windows画图程序(二)
  18. jquery dataTable 参数详解
  19. 明月镜片官宣品牌代言人刘昊然;Crocs与欧阳娜娜打造全新联名系列 | 美通企业日报...
  20. 施工部署主要不包括_施工管理目标是单位工程施工部署的重要内容,其目标不包括()。A.质量目标B.社会行为目标C.工期目标...

热门文章

  1. 从零开始的LC刷题(74): Reverse Vowels of a String
  2. Accumulation Degree
  3. HQL 报 return code 2 from org.apache.hadoop.hive.ql.exec.mr.MapRedTask 错误解决方案
  4. db2 修改表空间自增长_db2自动调整表空间的大小 - 木子日京的个人空间 - 51Testing软件测试网 51Testing软件测试网-软件测试人的精神家园...
  5. 给站长与网络推广人员的文章
  6. HDFS性能压测工具
  7. 如何修改大商创头部色调
  8. 通过游戏策划阶段防治游戏外挂
  9. 运行时:Linux 和 Windows 2000上的高性能编程技术
  10. Eureka健康检查