函数型数据分析若干方法及应用

【摘要】:许多领域所收集到的样本观测数据在数据空间中会呈现出一种明显的函数型特征,更多表现形式为光滑的曲线或连续的函数。在对函数型数据进行分析时,将观测到的数据(函数)看作一个整体,而不是一串数字,这是函数型数据分析方法与传统统计分析方法的本质区别。函数型数据分析的目标和传统统计学分析的目标基本一致,即:选用对进一步分析有利的方法来描述数据;为突出不同特征而对数据进行展示;研究数据类型的重要来源和数据之间的变化;利用输入(自变量的信息)来解释输出(因变量)的变化情况;对两组或者更多的某种类型的变量数据进行比较分析等等。

本文围绕上述目标,构建了一个比较完善、系统的函数型数据分析方法的理论框架。并在函数型数据分析方法的应用方面有所突破和拓展。主要从以下几个方面进行深入地研究。

1、基函数的选择。基函数展开是将观测得到的离散数据点平滑法预处理的重要手段。我们比较了最常用的傅里叶基函数、Bernstein基函数、B-样条基函数的各自优缺点以及它们的适用范围。更重要的是,本文构造出另外一些基函数:非均匀有理B-样条基函数、三角基函数和混合Bezier类基函数。并且指出,非均匀有理B-样条基函数克服了常用基函数无法准确描述曲线剧烈波动程度的缺点。三角基函数,提供了一个更加广阔的思路。利用该基函数构造的函数型数据曲线在满足一、二阶连续性方面减弱了多项式曲线要求的条件。混合Bezier类基函数不但保留了多项式基函数、有理B-样条基函数的优点,而且使计算更加简单。由此生成的函数型数据曲线具有更大的灵活性,得到更优的结果。

2、函数型数据曲线的光顺处理。惩罚函数法是传统的函数型数据曲线的光顺方法。除此之外,本文给出了能量光顺法的理论和方法。并在应用B-样条基函数的前提下,深入研究了局部能量最优光顺法、基于曲率均化的B-样条曲线能量光顺法、非均匀样条曲线光顺法以及分层能量光顺法。

基于均匀节点的B-样条曲线所提出的局部最优光顺法对于局部修改具有重要的实践意义,而且结果表明,该方法计算快速有效。

基于曲率均化的B-样条曲线能量光顺法,除了考虑数据曲线的应变能满足最小化的要求之外,加入对数据曲线的曲率要求。即对数据曲线施行曲率重新均化,这种均化的方法可以是基于累加弦长的,也可以是基于累加弧长的。

考虑到在实际数据观测中,所获得的数据未必是均匀的或者等距的。因此,由非均匀节点生成的样条曲线看成是非均匀样条曲线。非均匀样条曲线光顺法就是针对这种情况提出的能量光顺法。

分层能量法的基本思想是:首先,在一定误差范围内对原始曲线进行小波分解,目的是对曲线进行数据压缩和粗光顺,然后计算边界约束控制点,利用带约束条件的能量法对光顺后的曲线进行边界约束处理和细光顺。

3、对数据曲线分析方法的研究。在完善了函数型数据的方差分析、典型相关分析之后,主要对函数型数据的主成分分析方法做出了比较全面的研究和实证分析。本文另外一个创新点在于首次推导出基于欧式距离聚类分析的一些结论,指出在使用Fourier基函数和正交基函数展开后,函数型数据曲线的聚类分析可以转化,即是对展开项的生成空间中的点做普通的聚类分析。这大大简化了计算,提高了计算速度。并将Pearson相似系数引入聚类分析之中。特别提出了加权分段聚类分析的概念,不但把握数据曲线簇简单局部形态特征而且提高了聚类质量。

4、本文从三个角度研究了函数型数据分析方法的应用,这也是对应用领域的一个拓展和突破。首先,分析了汇改前后人民币汇率变动对国内物价的传递效应,将函数型数据分析方法应用到经济领域,并进行了实证分析,得出结论。其次,在基于函数型数据分析方法的笔迹甄别研究中,通过提取数据特征曲线,建立具有良好拟合性质的动态模型,得到了关于笔迹识别一些有用的结论。最后将函数型数据分析方法应用到猪肉价格指数的季节变动中,分析了猪肉价格指数较大波动区间和平稳区间。研究发现,猪肉价格指数的季节变动呈现循环变化的特征。并依据分析结果给出政策建议。

本文的主要创新包括:

1、首次将NURBS, Berstein引入到函数想数据分析方法中;

2、首次构造了三角基函数、混合Bezier类函数并将其应用到函数型数据分析方法中;

3、首次将能量光顺的思想引入到函数型数据分析方法中,并研究了几种能量光顺的具体实现方法;

4、指出函数型数据聚类分析方法在正交基下可以通过降维得到实现,并首次提出加权分段聚类的思想;

5、将函数型数据分析方法应用到经济领域,并进行了实证分析,得出结论。是对应用领域的一个拓展和突破。

【相似文献】

中国期刊全文数据库

前20条

1

周妍;;多尺度有限元法的基本原理[J];科协论坛(下半月);2009年04期

2

樊晓红;;样条函数与基于样条函数的数据拟合方法[J];科技信息;2011年09期

4

马庆华;;某些代数插值的统一与基函数的选取[J];惠州学院学报;1984年S2期

6

檀结庆;二次基函数的构造及其应用[J];合肥工业大学学报(自然科学版);1994年02期

8

罗军,何国庚,张师帅,黄素逸;高阶平滑基函数重建三维温度场[J];华中理工大学学报;1999年01期

9

谭茂金;张庚骥;赵文杰;;普通电阻率测井的新型数值模式匹配解法[J];石油天然气学报;2005年S1期

10

李善坡;隋允康;宇慧平;;采用基函数近似的响应面方法[J];北京工业大学学报;2006年S1期

11

李小秋;卢俊;贾宏燕;高劲松;冯晓国;孙连春;;具有双频段的十字形复合单元频率选择表面[J];红外与毫米波学报;2007年02期

12

陆利正;汪国昭;;二次带形状参数双曲B样条曲线[J];高校应用数学学报A辑;2008年01期

13

王阿霞;马逸尘;;复杂起伏地表的POD数值模拟[J];地球科学与环境学报;2008年02期

14

王沛;杨嘉林;郭翔;;小波去噪理论的仿真研究[J];科技广场;2009年09期

15

余小磊;唐烁;;三角网格上新的插值公式构造[J];中国科学技术大学学报;2011年06期

16

宁世光;宣仲良;;量子化学从头计算程序中基函数对称变换表的编制[J];山东师范大学学报(自然科学版);1984年02期

17

沈燮昌;Hermite 插值基函数正交展开求和[J];数学学报;1989年01期

18

孙红兵,奚梅成;一般的Hermite插值基函数的显式表示[J];中国科学技术大学学报;2001年04期

19

龙述尧,陈莘莘;关于无单元法中的插值基函数选取的探讨[J];湖南大学学报(自然科学版);2002年05期

20

吉家锋,张晓丽,谢维成;用MATLAB计算等距三次样条插值问题[J];四川工业学院学报;2003年S1期

中国重要会议论文全文数据库

前10条

1

周志刚;;故障检测中的人工神经网络[A];信号与信息处理技术第三届信号与信息处理全国联合学术会议论文集[C];2004年

2

李善坡;隋允康;;基函数近似响应面方法的研究[A];北京力学学会第12届学术年会论文摘要集[C];2006年

3

张建伟;玄书鹏;;浸没循环撞击流反应器压力波动信号的Hilbert-Huang谱分析[A];第三届全国化学工程与生物化工年会论文摘要集(上)[C];2006年

4

张传东;宋文武;;线天线输入导纳的矩量法分析[A];第六届全国电磁兼容性学术会议2004EMC论文集[C];2004年

5

高荣奉;;基础分析的改进有限条法[A];第五届全国结构工程学术会议论文集(第一卷)[C];1996年

6

罗健旭;邵惠鹤;;超闭球CMAC学习算法的改进和收敛性分析[A];2004中国控制与决策学术年会论文集[C];2004年

7

丁建军;朱剑;陈如山;丁大志;樊振宏;;一种用于电磁散射的多分辩预曲面RWG基函数[A];2009年全国微波毫米波会议论文集(下册)[C];2009年

8

杨颖怡;赵延文;陆田;;基于样条时间基函数的精确稳定时间步进算法[A];2009年全国天线年会论文集(上)[C];2009年

9

陶诗飞;郭星辰;胡小情;陈如山;;高阶相位基函数结合射线快速多极子方法分析电大尺寸结构问题[A];2011年全国微波毫米波会议论文集(下册)[C];2011年

10

杨伍琳;郭建道;黄新媚;罗祖红;;自动气象站数据分析与状态检测报警系统[A];中国气象学会2005年年会论文集[C];2005年

中国博士学位论文全文数据库

前10条

1

陈宜治;函数型数据分析若干方法及应用[D];浙江工商大学;2011年

2

殷瑞飞;数据挖掘中的聚类方法及其应用[D];厦门大学;2008年

4

徐小红;图像信息的基函数表示方法研究[D];合肥工业大学;2009年

6

韩晓刚;复杂运输机械装备运行安全的研究[D];重庆大学;2006年

7

崔旭明;B样条与无条件稳定的子区间法[D];天津大学;2007年

9

中国硕士学位论文全文数据库

前10条

1

张帆;陀螺加速寿命试验研究[D];南京理工大学;2006年

3

朱慧平;智力因素对俄语学习策略影响的实证研究[D];东北师范大学;2009年

5

胡勇;基于神经网络的个人信用模型[D];西南财经大学;2006年

6

刘利华;信号完整性分析及仿真波形自动分析技术研究[D];西安电子科技大学;2007年

7

陈红权;土地利用更新调查技术的研究与应用[D];河海大学;2007年

8

郭莉霞;科技型企业员工满意度实证研究[D];北京邮电大学;2008年

9

田禾;全国林产品对外贸易信息管理系统的研建[D];北京林业大学;2008年

10

范淑静;火焰辐射光谱数据存储、查询及分析系统[D];西安电子科技大学;2008年

中国重要报纸全文数据库

前10条

1

杨小刚;多一些数据说话,少一些观念争论[N];第一财经日报;2008年

2

邹小丹;推出全新商务差旅数据分析[N];中华工商时报;2006年

3

本报记者  徐效鸿;指数连阳 板块与个股普涨[N];中国证券报;2006年

4

本报记者  徐效鸿;题材股逞强 复牌G股走弱[N];中国证券报;2006年

5

;增长持续快速应用更趋多样[N];人民邮电;2005年

6

记者 徐琦;国家环保总局通报松花江水污染情况[N];中国环境报;2005年

7

严吕勇;从经验管理到数据管理[N];计算机世界;2005年

8

本报记者 徐效鸿;绩优绩差齐跌 板块表现平淡[N];中国证券报;2006年

9

惠正一;脑袋VS数据 精准计量营销将效果最大化[N];第一财经日报;2007年

10

北京市工商局副局长 罗文阁;深化年检数据分析 拓展企业年检功效[N];中国工商报;2007年

python傅立叶光顺_函数型数据分析若干方法及应用相关推荐

  1. Python训练营—Tesk3—Python基础进阶—从函数到高级魔方方法

                    Python基础进阶--从函数到高级魔方方法 目录 Python基础进阶--从函数到高级魔方方法 一.函数 1.函数的定义 2.函数的调用 3.函数参数 4.变量作用域 ...

  2. python电商_电商数据分析(python)

    一.背景及目的 从多维度对某平台2016年电商数据进行分析,总结销售规律,为来年销售计划做准备,指导之后的产品销售. 二.理解数据 三.提出分析思路 四.数据清洗 此部分请见我之前写的文章:电商数据分 ...

  3. 数据分享|函数型数据分析部分省市新冠疫情数据

    作者:Mingji Tang 统计学中传统的数据类型有截面数据和时间序列数据.这两者都只能在某一纵向或横向上探究数据,且部分前提条件又很难满足.而函数型数据连续型函数与离散型函数长期以来的分离状态,实 ...

  4. python猿辅导_如何用数据分析方法剖析“猿辅导”K12课程

    前言 本次分析只是用猿辅导的案例来分享数据分析的思路和方法论.禁止将分析结果用于任何商业目的以及非法行为,若引起法律纠纷后果自负.同时声明数据来源与猿辅导官网关键指标数据未必真实. 概述 笔者将通过以 ...

  5. python 编程效率_如何有效提升数据分析效率?五大Python技巧

    如何有效提升数据分析效率?相信这是所有数据分析工作者都想解决的问题.本文整理了五大python技巧,分别是Pandas Profiling:使用 Cufflinks 和 Plotly 绘制 Panda ...

  6. Python基本语法_函数_返回值

    目录 目录 前言 函数的返回值 在函数中Return和Print的区别 函数中的文档 前言 函数的返回值是函数重要的组成部分.函数的根本在于实现程序的部分功能,所以很多时候我们需要将函数执行后的结果返 ...

  7. Python基本语法_函数_参数的多类型传值

    前言 上一篇主要介绍了Python函数的参数类型,本篇继续学习Python函数多类型传值. 目录 前言 目录 软件环境 参数的多类型传值 向函数传递Tuple 向函数传递List 向函数传递Dicti ...

  8. Python基本语法_函数属性 参数类型 偏函数的应用

    目录 目录 前言 软件环境 Python Module的程序入口 函数的属性 Python函数的创建 函数的参数 必备参数 缺省参数 命名参数 不定长参数 匿名参数 偏函数的应用 前言 Python除 ...

  9. python 查找函数所在模块和文件位置_查看python的模块和函数帮助文档方法

    python的一个优势是有着大量自带和在线的模块(module)资源,可以提供丰富的功能,在使用这些模块的时候,如果每次都去网站找在线文档会过于耗费时间,结果也不一定准确.因此这里介绍下python自 ...

  10. Python基础学习_函数数def_返回值及返回值类型_函数块

    一. 返回值 函数作用:显示输出.处理数据并返回数据结果 函数返回值的定义:函数返回值被称为返回值 写法: 函数体内 return 返回值 (将值返回到调用函数的代码行) 返回值类型: "& ...

最新文章

  1. Android URL
  2. Rolling Guidance Filter
  3. centos5安设apache和svk运用域用户验证
  4. margin: 0 auto没有水平居中怎么回事
  5. 基于语言模型的少样本学习 / 深度学习优化器基准测试 | 本周值得读
  6. Caused by: java.net.BindException: Could not start rest endpoint on any port in port range 8085
  7. 多线程编程2-NSOperation
  8. 【2018.3.31】模拟赛之二-ssl2407 负进制【贪心】
  9. u盘弹出工具_双佳数码 | 电脑u盘无法弹出怎么办?
  10. oracle账户用root权限执行sh,安装Oracle执行orainstRoot.sh与root.sh作用
  11. Message、Handler、Message Queue、Looper、Thread之间的关系(未完成)
  12. Anaconda常用指令
  13. EJB是什么,什么是EJB
  14. 圆柱体积怎么算立方公式_圆柱的立方计算公式
  15. python从excel中读取数据然后随机选一个_从Python读取Excel复选框
  16. rrpp协议如何修改_华为交换机―RRPP协议
  17. 复旦-华盛顿大学EMBA 二十年20人丨徐欣:从外企转战民企的变身
  18. 高含金量国际计算机编程竞赛
  19. Swift中什么时候不能用 () 代替 Void 来使用
  20. suricata 命令

热门文章

  1. 如何测试自己适合什么大学专业
  2. 2022年华为杯中国研究生数学建模竞赛A题思路
  3. linux vi带 替换,vim替换命令_Linux vi/vim替换命令使用集锦
  4. ARM指令集与Thumb指令集与Thumb-2指令集的区别
  5. CPDA|数据分析师需要具备哪些基本功?
  6. C#照片合成PDF_ PDF合成或拆分PDF_PDF获取页数
  7. python 自动控制鼠标移动脚本
  8. mergesort java_排序--归并排序MergeSort(Java实现)
  9. CentOS 8 安装Tomcat
  10. 谷歌浏览器屏蔽广告插件