基于惩罚函数的回归量变选择方法

基于惩罚函数的Beta回归变量选择方法

内容提要:当因变量取值在(0,1)区间的比例数据时,Beta回归是常用的模型,该模型基于因变量服从Beta分布的假设,通过连接函数将样本服从Beta分布的均值与自变量联系起来。本文主要研究基于惩罚函数的Beta回归模型变量选择方法,研究了在LASSO SCAD和MCP三种惩罚方法下的极大似然估计,同时实现了变量选择和回归系数的估计。本文还研究了其渐进性质与Oracle性质,并且给出了计算机模拟。最后,将该方法应用到股息率的影响因素研究中。

关键词:Beta回归;变量选择;惩罚函数;Oracle性质

中图分类号:0212 文献标识码:Avariables via link function. This article main focus on the variable selection for beta regression based on penalized function, giving maximum likelihood estimation with LASSO, SCAD and MCP penalty methods, the variable selection and estimation of coefficients can be conducted at the same time. We also give the proof of its asymptotical and oracle properties and the results of simulations. Finally, we apply this method to select significant factors for dividend rate.

Key Words: Beta Regression; Variable selection; Penalized function; Oracle Properties

一、引言

线性回归模型是的回归模型,,但对因变量限制在区间的,线性回归拟合值落在区间外。法是将因变量到实数区间上用自变量与转换后的因变量的均值建模。然而,这种方法的系数难以解释,而且比例数据通常具有非对称性,正态分布假设下做出的推断可能会导致预测失误。为解决传统回归所存在的问题,Ferrari Cribari-Neto(2004)提出了Beta回归。由于Beta分布的密度函数形状变化十分灵活,能够描述各种各样的分布。Beta回归模型的参数估计和统计诊断可以通过R包betareg实现Cribari-Neto 和Zeileis,2010)。

计算机技术的飞速发展,极大地便利了数据的获取和存储,部门大量的数据,比如股票市场的逐笔交易记录、商业银行交易记录同时这些数据的维度也越来越高从理论上来说,一方面会导致模型不稳健,极大地降低了估计和预测精度;另一方面会加大模型的复杂度,无法突出最的变量。在,大量的自变量减少模型的偏差。常用的有最优子集法subset selection)、逐步(向前、向后)回归法(stepwise)、逐段法(stagewise)等。但是存在许多缺点Fan和Li指出最优子集法遍历所有子集搜索最优解,因此计算成本高,特别是很大时,基本不可能实现求解; Breiman指出逐步回归法缺乏稳定性,对数据的微小变动非常敏感。惩罚函数法是目前高维数据研究领域广受欢迎的一类方法,它通过对模型的回归系数进行约束,使部分系数压缩为零,实现变量选择,克服了传统方法计算量大和稳定性差等缺点。基于最小二乘方法的惩罚回归least absolute shrinkage and selection operator)(Tibshirani,1996),SCAD( the smoothly clipped absolute deviation)(Fan and Li,2001)和MCP (minimax concave penalty) Zhang,2010)等。这种法随后也被极大似然估计。与传统的变量选择方法不同,的极大似然估计性质,当tuning parameter)选择时,基于非凹惩罚函数的极大似然估计在变量选择方面具有性质,当真实的回归系数为0时,参数估计值依概率收敛到0,而非0系数的估计值与只用非0系数的变量进行回归时具有相同的表现。简而言之,基于非凹惩罚函数的极大似然估计估计好像提前知道了那些系数为0,哪些系数不为0,该种性质被称为Oracle性质。本文的主要目的Beta回归变量选择方法。本文的:第部分介绍了Beta回归模型;第部分介绍惩罚的似然估计渐进性质;第部分计算机模拟;第部分

二、Beta回归模型

Beta回归因变量服从Beta

oracle性质是渐进正态性,基于惩罚函数的回归量变选择方法.doc相关推荐

  1. 极大似然估计的渐进正态性

    <极大似然估计的 Bahadur 渐近有效性>,成平, <数学学报>, 1980年06期 asymptotically efficient estimator 渐近有效估计量 ...

  2. 入门必学 | R语言数据的独立性,正态性及方差齐性检验

    参数分析的三大前提检验 检验数据独立性的方法 Chisq检验 Fisher检验 Cochran-Mantel-Haenszel检验 检验数据正态性的方法 shapiro.test函数 qqnorm函数 ...

  3. 用 BOX-COX 变换进行数据正态性处理

    笔者之前写了题为<用Python讲解偏度和峰度>的文章,在那篇文章里,笔者介绍了偏度.峰度以及如何基于二者进行数据正态性的判断,而今天笔者将介绍一下如何将数据进行正态性转换. 在我们进行数 ...

  4. 《白话统计》笔记之正态性与方差齐性

    写在前面:不得不说<白话统计>这本书真的太赞了,它让我再次感受到统计的魅力,我觉得一个高水平的人是能够把知识以通俗易懂的方式表达出来,这让我兴奋,真的推荐大家去看下. 1. 什么是正态性和 ...

  5. R语言普通最小二乘(OLS)回归说明、以及构建普通最小二乘(OLS)回归需要满足的四个假设(Normality(正态性)、Independence(独立性)、Linearity(线性度)、方差齐性)

    R语言普通最小二乘(OLS)回归说明.以及构建普通最小二乘(OLS)回归需要满足的四个假设(Normality(正态性).Independence(独立性).Linearity(线性度).方差齐性) ...

  6. R语言回归模型构建、回归模型基本假设(正态性、线性、独立性、方差齐性)、回归模型诊断、car包诊断回归模型、特殊观察样本分析、数据变换、模型比较、特征筛选、交叉验证、预测变量相对重要度

    R语言回归模型构建.回归模型基本假设(正态性.线性.独立性.方差齐性).回归模型诊断.car包诊断回归模型.特殊观察样本分析.数据变换.模型比较.特征筛选.交叉验证.预测变量相对重要度 目录

  7. R语言Kolmogorov-Smirnov假设检验(正态性检验):检验数据的正态性

    R语言Kolmogorov-Smirnov假设检验(正态性检验):检验数据的正态性 目录 R语言Kolmogorov-Smirnov假设检验(正态性检验):检验数据的正态性

  8. bartlett方差齐性检验_R语言实用教程-数据正态性以及方差齐性检验

    第一节:数据正态性分析 数据是不是正态分布是接下来选择正确的分析方法的基础.因为通常的方差分析用到的都要求是正态分布的数据(或者经过转换之后为正态的数据).而数据如果不满足正态性,那么通常要选择非参数 ...

  9. 如何检验数据样本的正态性?

    正态分布是自然界中最常见的也是一种最重要的分布.因此,人们在使用统计分析方法时,总是乐于正态假定,但该假定是否成立,就需要进行正态性检验了. 定义: 指如果一组观测值来自正态总体.具有正态分布的特性, ...

  10. 利用Matlab考察数据的边缘正态性 作Q_Q图

    一.实验数据 需要考察多个变量的边缘正态性 二.考察边缘正态性 1.原理 可以通过对每个变量的样本观测值的边缘分布作Q_Q图和计算相关系数 r_Q 来考察. Matlab自带有作Q_Q图的函数qqpl ...

最新文章

  1. textview加载html glide,TextView加载HTML,文字和图片
  2. 在星辰世界的guandan
  3. 特斯拉标准续航版Model Y为什么下架?马斯克这么回答
  4. JavaScript的组成
  5. 魔兽争霸3地图(WarIII Maps):成神之路
  6. Flutter监听网络变化
  7. python画散点图分布-python中画散点图
  8. matlab匹配滤波检测频谱感知,一种基于匹配滤波器的频谱感知和主用户功率识别方法...
  9. 烽火HG680-R-MSO9280-河南电信_湖北联通免费刷机固件及说明
  10. 模拟退火算法(simulated annealing algorithm)求极值
  11. 微信分享服务器,微信分享的链接会被腾讯后台先访问
  12. js屏蔽手机的物理返回键
  13. 【python角谷猜想】
  14. MacBook, OS X系统下解压RAR文件
  15. OD修改 exe文件 成功登录,je、jmp、nop、test汇编指令分析《逆向工程》
  16. Sentinel-2数据辐射定标及大气校正
  17. 创业启动第一步,就是写一份规范的商业计划书(BP)
  18. 计算机切换到弧度模式,卡西欧fx 82es计算机怎么吧.角度转弧度. 或互转
  19. h5的video标签的用法及问题
  20. 一键清除苹果锁屏密码_苹果iPhone 8(全网通)手机一直重启怎么办?手机忘记密码怎么一键刷机?...

热门文章

  1. Node.js-威富通H5微信支付
  2. python仓库管理
  3. python怎么对数用log,python中的对数log函数表示及用法
  4. 火山视频去水印,无水印视频解析原理及实现
  5. 如何将手机哔哩哔哩缓存的m4s格式的视频转换成mp4呢?
  6. H5调起手机端的摄像头
  7. html5手机摄像头相册批量,h5调用手机摄像头/相册(示例代码)
  8. 微信PC版怎么安装旧版本
  9. xcode 打包ipa
  10. oracle有rtf函数,Delphi中对Oracle存取RTF文档_Delphi