我试图用statsmodels将Poisson分布拟合到我的数据中,但是我对得到的结果和如何使用库感到困惑。

我的真实数据将是一系列的数字,我认为我应该能够描述为泊松分布加上一些离群值,所以最终我想做一个稳健的数据拟合。

但是出于测试目的,我只是使用scipy.stats.poisson创建一个数据集samp = scipy.stats.poisson.rvs(4,size=200)

所以要用statsmodels来拟合,我想我只需要一个常数‘endog’res = sm.Poisson(samp,np.ones_like(samp)).fit()

打印摘要()Poisson Regression Results

==============================================================================

Dep. Variable: y No. Observations: 200

Model: Poisson Df Residuals: 199

Method: MLE Df Model: 0

Date: Fri, 27 Jun 2014 Pseudo R-squ.: 0.000

Time: 14:28:29 Log-Likelihood: -404.37

converged: True LL-Null: -404.37

LLR p-value: nan

==============================================================================

coef std err z P>|z| [95.0% Conf. Int.]

------------------------------------------------------------------------------

const 1.3938 0.035 39.569 0.000 1.325 1.463

==============================================================================

好吧,这看起来不对,但如果我是res.predict()

我得到一个4.03的数组(这是这个测试样本的平均值)。

所以基本上,首先,我很困惑如何从statsmodel解释这个结果,其次,如果我对分布的稳健参数估计感兴趣,而不是拟合趋势,我可能会做一些完全不同的事情,但我应该怎么做呢?

编辑

为了回答我问题的第二部分,我真的应该给出更多的细节。

我有一个事件在一个开始时间之后随机发生。当我绘制许多事件的延迟时间直方图时,我看到分布看起来像是比例泊松分布加上几个异常点,这些异常点通常是由底层系统中的问题引起的。所以我只想找到数据集的预期时间延迟,不包括异常值。如果不是异常值,我可以简单地找到平均时间。我想我可以手动排除它们,但我想我可以找到更严格的东西。

编辑

在进一步的思考中,我将考虑其他分布,而不是坚持泊松分布,我的问题的细节可能会分散对原始问题的注意力,但我还是把它们留在这里了。

python 拟合分布_stats模型中数据的Poisson分布拟合相关推荐

  1. python KS检验:检验数据是否服从指定分布;或两份数据源于同一分布

    KS检验 原假设:两份数据源于同一分布 拒绝假设:两份数据源于不同的分布 一般当p值低于0.01或0.05时,拒绝原假设,即认为两份数据源于不同的分布. 双样本KS检验 from scipy.stat ...

  2. python如何保存列表_python中数据的保存

    1.将list中的数据写入到excel文件中 利用python包numpy(实现方式应该有许多种,这里只是记录成功实现的一种)中的savetxt 局限性:要保存的list可以为[1,2,3,4,5]这 ...

  3. 计算机网络中数据包的分布,计算机网络习题

    练习 计算机网络概述 1.以太网在传送数据时,将数据分成若干帧,每个节点每次可传送__1___个帧. 2.在广域网中,计算机需要传送的信息预先都分成若干个组,然后以________为单位在网上传送. ...

  4. Keras模型中数据维度报错

    ValueError: Input 0 of layer dense is incompatible with the layer: expected axis -1 of input shape 使 ...

  5. python对数字排序_Python中数据的排序

    目录 列表的排序 列表的排序可以使用列表自带的 sort() 方法,也可以使用 sorted() 函数 sort() 方法是修改原列表:而 sorted() 函数是对列表的复制再排序,返回一个新的列表 ...

  6. python读取sav文件_Numpy中数据的常用的保存与读取方法

    小书匠 深度学习 文章目录: 在经常性读取大量的数值文件时(比如深度学习训练数据),可以考虑现将数据存储为Numpy格式,然后直接使用Numpy去读取,速度相比为转化前快很多. 下面就常用的保存数据到 ...

  7. python示例--下载mysql数据库中数据--excel表格,合并表格

    用到的知识点 1.mysql连接 2.pandas的concat数据合并 3.路径等 import threading import requests import json import pymys ...

  8. python批量转换数据类型_python中数据类型转换

    1.list转str 假设有一个名为test_list的list,转换后的str名为test_str 则转换方法: test_str = "".join(test_list) 例子 ...

  9. 5层模型中数据从源主机到目的主机之旅

    报文是用户发送的数据 传输层可能对报文进行拆分,加上段头 网络层会加上网络层的头,构成的协议数据单元叫做数据报 链路层会加头加尾构造帧 路由器的链路层会去掉帧头帧尾,还原到网络层数据报 再次封装成链路 ...

  10. R语言使用lm函数构建简单线性回归模型(建立线性回归模型)、拟合回归直线、可视化散点图并添加简单线性回归直线、添加模型拟合值数据点、添加拟合值点和实际数据点之间的线段表示残差大小、col参数自定义设置

    R语言使用lm函数构建简单线性回归模型(建立线性回归模型).拟合回归直线.可视化散点图并添加简单线性回归直线.添加模型拟合值数据点.添加拟合

最新文章

  1. Node.js与Sails~方法拦截器policies
  2. 保护眼睛设置.txt
  3. Selenium3自动化测试——4. 获取百度备案信息
  4. winfrom。布局
  5. 使用FindAncestor查找方式绑定且不需要使用datacontext
  6. php fstat,PHP函数fstat介绍
  7. sql的join语法解析
  8. js中占位符总结积累
  9. bzoj 1669: [Usaco2006 Oct]Hungry Cows饥饿的奶牛
  10. DOCKER基础技术:LINUX CGROUP
  11. 【任务分配】基于matlab蚁群算法无人机任务分配【含Matlab源码 1265期】
  12. html如何修改字体黑体,css如何设置黑体样式?
  13. 【Vue】Vue项目的创建以及饿了么UI的使用
  14. 程序员必备的英语词汇表-持续更新
  15. 163邮箱怎么注册,怎么给邮箱起一个好用的用户名?
  16. hardfault常见原因_stm32 HardFault_Handler调试及问题查找方法
  17. PHP处理iso8583报文
  18. SAAS的概念及优缺点
  19. 推荐几个Github中国区排名前100的公众号
  20. 滴滴出行开具行程发票用于企业报销

热门文章

  1. 数字逻辑电路——简单知识点整理(乱)
  2. 使用fisheye4.8(crucible4.8)添加仓库时出现的问题
  3. 新换的手机号码被人注册了微信怎么办?
  4. matlab绘制图形hold on_matlab中hold on是什么意思
  5. 搜集ipv6 DNS服务器信息,IPV6 DNS服务器地址列表
  6. 张开翅膀,放飞梦想,让光彩无限绽放!
  7. 计算机无法打印 重启又好了,打印机显示通讯错误,不能打印,但电脑重启后又好了!这是为什么?...
  8. Classic Shell不起作用(失效)的解决
  9. 有向图和有权图的邻接矩阵表示法
  10. 三位数码管电路设计实验