Hello 大家好,我是一名新来的金融领域打工人,日常分享一些python知识,都是自己在学习生活中遇到的一些问题,分享给大家,希望对大家有一定的帮助!

相信大家在平时的统计分析中,一定会用到数组偏度以及峰度的计算,那么什么是偏度?什么是峰度呢?

偏度(skewness)也称为偏态、偏态系数,是统计数据分布偏斜方向和程度的度量,是统计数据分布非对称程度的数字特征。——来自百度百科

峰度(peakedness;kurtosis)又称峰态系数。表征概率密度分布曲线在平均值处峰值高低的特征数。直观看来,峰度反映了峰部的尖度。样本的峰度是和正态分布相比较而言统计量,如果峰度大于三,峰的形状比较尖,比正态分布峰要陡峭。反之亦然。——来自百度百科

咱们直接来看公式吧:

偏度 = 三阶中心距 / 标准差的三次方

峰度 = (四阶中心矩 / 方差的平方)- 3

好了,知道了偏度与峰度的定义以及计算公式,我们直接上代码:


方法1:通过pandas计算偏度与峰度

首先我们构建一个array数组,然后把它转为Serise数据格式

a = np.array([3,6,3,9,10,12,36,3])
s1 = pd.Series(a)
print(s1)

我们打印一下结果看看:

0     3
1     6
2     3
3     9
4    10
5    12
6    36
7     3
dtype: int32

下面我们计算偏度和峰度,pandas使用起来特别方便如下所示:

print(s1.skew(),s1.kurt(),s1.kurtosis())

我们看看结果,第一个数是偏度,第二个数和第三个数都是峰度(两者的结果是一样的)

2.2834315607184914 5.684904087149228 5.684904087149228

2.通过stats计算偏度与峰度

from scipy import stats
print(stats.skew(a),stats.kurtosis(a))

我们来看一下结果,第一个数是偏度,第二个数是峰度

1.8308182642189486 2.0404305176901083

咦,怎么两种方法算出来的结果不一样呢?

我们看一下两种方法所求的标准差:

print(s1.std()) ## (除以n-1) 无偏 pandas方法
print(stats.tstd(s1)) ## (除以n-1) 无偏 stats方法
print(np.std(s1)) ## (除以n) 有偏 numpy方法
print(np.std(s1,ddof=1)) ## (除以n-1) 无偏 numpy方法

我们看看结果:

10.977249200050075
10.977249200050075
10.268276388956425
10.977249200050075

我们发现,第1,2,4结果是一样的,第3个结果与其他的不一样,其实这里的不同就体现在标准差的计算中,也就是无偏与有偏的区别。

使用Pandas计算峰度与偏度是无偏的,而使用Stats计算偏度与峰度是有偏的,这就导致计算出的结果不一致。

3.自己通过代码来实现计算偏度与峰度

first_central_moment = (sum(a - np.mean(a)))/len(a)  ##一阶中心矩
Third_central_moment = (sum((a - np.mean(a))**3))/len(a)  ##三阶中心矩
Four_central_moment = (sum((a - np.mean(a))**4))/len(a)  ##四阶中心矩
skew = Third_central_moment/(np.std(a)**3) ##skew
kurt = (Four_central_moment/(np.var(a))**2) - 3 ##kurt

我们来打印一下结果,第一项是偏度,第二项是峰度:

1.8308182642189486 2.0404305176901083

这个结果是和stats计算出来的结果一样的!结果都是有偏的

其实方差就是二阶中心矩,让我们来看看不同方法的计算结果:

s1.var() #pandas方法
np.var(a,ddof=1) #numpy方法
stats.tvar(a) #stats方法
(sum((a - np.mean(a))**2))/(len(a)-1) #自定义二阶中心矩计算方法

我们打印一下结果:

发现他们的结果是一样的,并且结果都是无偏结果。

以下代码计算的应该都是无偏的结果,我们打印一下:

first_central_moment = (sum(a - np.mean(a)))/(len(a)-1) ##一阶中心矩
Third_central_moment = (sum((a - np.mean(a))**3))/(len(a)-1) ##三阶中心矩
Four_central_moment = (sum((a - np.mean(a))**4))/(len(a)-1)  ##四阶中心矩
skew = Third_central_moment/(np.std(a,ddof=1)**3) ##skew
kurt = (Four_central_moment/(np.var(a,ddof=1))**2) - 3 ##kurt
print(skew,kurt)
1.7125736705388683 1.4103767029788452

发现还是和pandas计算的结果不一样,原因我还在寻找。。。

附上两篇优秀的文章:

有偏估计和无偏估计  python pandas库和stats库计算偏度和峰度(附程序)

今天的文章就分享到这里啦!

python金融分析小知识(6)——偏度与峰度的计算相关推荐

  1. python金融分析小知识(35)——最大回撤的计算

    Hello 大家好,我是一名新来的金融领域打工人,日常分享一些python知识,都是自己在学习生活中遇到的一些问题,分享给大家,希望对大家有一定的帮助! 今天就给大家讲讲在进行量化策略回测结果分析的时 ...

  2. python金融分析小知识(30)——比较常见的pd.set_option的使用

    Hello 大家好,我是一名新来的金融领域打工人,日常分享一些python知识,都是自己在学习生活中遇到的一些问题,分享给大家,希望对大家有一定的帮助! 哈喽大家好,今天我要给大家讲讲在pandas的 ...

  3. python金融分析小知识(22)——时间序列之Timestamp对象的处理

    Hello 大家好,我是一名新来的金融领域打工人,日常分享一些python知识,都是自己在学习生活中遇到的一些问题,分享给大家,希望对大家有一定的帮助! 在我的这篇文章中我有介绍到时间序列中的Tims ...

  4. python金融分析小知识(12)——python爬虫工具xpath使用

    Hello 大家好,我是一名新来的金融领域打工人,日常分享一些python知识,都是自己在学习生活中遇到的一些问题,分享给大家,希望对大家有一定的帮助! 本篇文章紧接上一篇文章,python金融分析小 ...

  5. python金融分析小知识(38)——Jupyter Notebook更改文件路径

    Hello 大家好,我是一名新来的金融领域打工人,日常分享一些python知识,都是自己在学习生活中遇到的一些问题,分享给大家,希望对大家有一定的帮助! 大家好,好久不见我又来啦!今天要给大家分享的小 ...

  6. python金融分析小知识(34)——年化收益率、年化波动率以及夏普比率的计算

    Hello 大家好,我是一名新来的金融领域打工人,日常分享一些python知识,都是自己在学习生活中遇到的一些问题,分享给大家,希望对大家有一定的帮助! 大家好呀 好久不见!最近忙的事情太多了 没来得 ...

  7. python金融分析小知识(19)——NLP初探之LDA话题建模

    Hello 大家好,我是一名新来的金融领域打工人,日常分享一些python知识,都是自己在学习生活中遇到的一些问题,分享给大家,希望对大家有一定的帮助! 让机器帮助我们在海量的文本中快速找到关键信息, ...

  8. python金融分析小知识(27)——如何通过python连接Wind(万得)数据库

    Hello 大家好,我是一名新来的金融领域打工人,日常分享一些python知识,都是自己在学习生活中遇到的一些问题,分享给大家,希望对大家有一定的帮助! 今天要个大家讲的是一个十分重要的知识,在我们平 ...

  9. python金融分析小知识(21)——如何计算股票、基金的收益净值曲线并通过python绘制

    Hello 大家好,我是一名新来的金融领域打工人,日常分享一些python知识,都是自己在学习生活中遇到的一些问题,分享给大家,希望对大家有一定的帮助! 今天给大家讲讲如何计算股票或者基金的净值曲线, ...

  10. python金融分析小知识(29)——使用pandas输出excel表格并且在不同的sheet中

    Hello 大家好,我是一名新来的金融领域打工人,日常分享一些python知识,都是自己在学习生活中遇到的一些问题,分享给大家,希望对大家有一定的帮助! 今天要给大家讲的是pandas导出excel文 ...

最新文章

  1. 上汽大众系统服务器,上汽大众这次放大招了!简单却不平凡的智慧互联系统有多厉害?...
  2. 如何写出健壮的代码?
  3. 网络安全:与 TCP 连接管理相关的网络攻击
  4. SAP CRM Division customizing
  5. Java JVM 汇编代码入门 GitChat链接
  6. [原创]独立模式安装Hive
  7. PHP培训领航者兄弟连IT教育推出兄弟会教育模式
  8. 如何实现网站访问量统计(html页面)
  9. Python机器学习英文资源
  10. 安装deepin微信报错: dpkg: 依赖关系问题使得 deepin.com.wechat:i386 的配置工作不能继续 解决办法如下:
  11. 【简单入门】ChatGPT prompt engineering (中文版)笔记 |吴恩达ChatGPT 提示工程
  12. 基因家族分析⑦:用MEME查询基因家族的motif
  13. oracle数据库存储管理--ASM
  14. android t9 实体键盘,最强安卓老人机 T9键盘/爷爷的荣耀神器
  15. 聊天机器人技术分析综述
  16. 什么是缓冲区(buffer),什么是缓存(cache)
  17. 图形学课设 塔防游戏
  18. Instant Client Light:unsupported server character set ZHS16GBK
  19. 【网盘项目日志】20210601:Seafile 离线下载系统开发(2)
  20. Unity之UGUI-特效遮挡问题

热门文章

  1. android和iOS平台的崩溃捕获和收集
  2. Enhancing Diversity in Teacher-Student Networks via Asymmetric branches for Unsupervised reid论文解读
  3. IF NOT EXISTS和 IF EXISTS的区别
  4. 攻防演练中防守方的骚姿势
  5. c语言竖线什么意思,竖线符号意思
  6. Vimium插件使用方法(其实就是盗了一张图)
  7. 郑捷《机器学习算法原理与编程实践》学习笔记(第四章 推荐系统原理)(一)推荐系统概述...
  8. QT中的explicit关键字的意思
  9. 计算机不能连接网络适配器,网络适配器显示未连接的解决方法图文教程
  10. thinkcmf图片上传七牛云不显示的问题(七牛图片后缀!watermark)