python 拟合分布_stats模型中数据的Poisson分布拟合

我试图用statsmodels将Poisson分布拟合到我的数据中，但是我对得到的结果和如何使用库感到困惑。

我的真实数据将是一系列的数字，我认为我应该能够描述为泊松分布加上一些离群值，所以最终我想做一个稳健的数据拟合。

但是出于测试目的，我只是使用scipy.stats.poisson创建一个数据集samp = scipy.stats.poisson.rvs(4,size=200)

所以要用statsmodels来拟合，我想我只需要一个常数‘endog’res = sm.Poisson(samp,np.ones_like(samp)).fit()

打印摘要()Poisson Regression Results

==============================================================================

Dep. Variable: y No. Observations: 200

Model: Poisson Df Residuals: 199

Method: MLE Df Model: 0

Date: Fri, 27 Jun 2014 Pseudo R-squ.: 0.000

Time: 14:28:29 Log-Likelihood: -404.37

converged: True LL-Null: -404.37

LLR p-value: nan

==============================================================================

coef std err z P>|z| [95.0% Conf. Int.]

------------------------------------------------------------------------------

const 1.3938 0.035 39.569 0.000 1.325 1.463

==============================================================================

好吧，这看起来不对，但如果我是res.predict()

我得到一个4.03的数组(这是这个测试样本的平均值)。

所以基本上，首先，我很困惑如何从statsmodel解释这个结果，其次，如果我对分布的稳健参数估计感兴趣，而不是拟合趋势，我可能会做一些完全不同的事情，但我应该怎么做呢？

编辑

为了回答我问题的第二部分，我真的应该给出更多的细节。

我有一个事件在一个开始时间之后随机发生。当我绘制许多事件的延迟时间直方图时，我看到分布看起来像是比例泊松分布加上几个异常点，这些异常点通常是由底层系统中的问题引起的。所以我只想找到数据集的预期时间延迟，不包括异常值。如果不是异常值，我可以简单地找到平均时间。我想我可以手动排除它们，但我想我可以找到更严格的东西。

编辑

在进一步的思考中，我将考虑其他分布，而不是坚持泊松分布，我的问题的细节可能会分散对原始问题的注意力，但我还是把它们留在这里了。

python 拟合分布_stats模型中数据的Poisson分布拟合相关推荐

python KS检验：检验数据是否服从指定分布；或两份数据源于同一分布
KS检验原假设:两份数据源于同一分布拒绝假设:两份数据源于不同的分布一般当p值低于0.01或0.05时,拒绝原假设,即认为两份数据源于不同的分布. 双样本KS检验 from scipy.stat ...
python如何保存列表_python中数据的保存
1.将list中的数据写入到excel文件中利用python包numpy(实现方式应该有许多种,这里只是记录成功实现的一种)中的savetxt 局限性:要保存的list可以为[1,2,3,4,5]这 ...
计算机网络中数据包的分布,计算机网络习题
练习计算机网络概述 1．以太网在传送数据时,将数据分成若干帧,每个节点每次可传送__1___个帧. 2．在广域网中,计算机需要传送的信息预先都分成若干个组,然后以________为单位在网上传送. ...
Keras模型中数据维度报错
ValueError: Input 0 of layer dense is incompatible with the layer: expected axis -1 of input shape 使 ...
python对数字排序_Python中数据的排序
目录列表的排序列表的排序可以使用列表自带的 sort() 方法,也可以使用 sorted() 函数 sort() 方法是修改原列表:而 sorted() 函数是对列表的复制再排序,返回一个新的列表 ...
python读取sav文件_Numpy中数据的常用的保存与读取方法
小书匠深度学习文章目录: 在经常性读取大量的数值文件时(比如深度学习训练数据),可以考虑现将数据存储为Numpy格式,然后直接使用Numpy去读取,速度相比为转化前快很多. 下面就常用的保存数据到 ...
python示例--下载mysql数据库中数据--excel表格，合并表格
用到的知识点 1.mysql连接 2.pandas的concat数据合并 3.路径等 import threading import requests import json import pymys ...
python批量转换数据类型_python中数据类型转换
1.list转str 假设有一个名为test_list的list,转换后的str名为test_str 则转换方法: test_str = "".join(test_list) 例子 ...
5层模型中数据从源主机到目的主机之旅
报文是用户发送的数据传输层可能对报文进行拆分,加上段头网络层会加上网络层的头,构成的协议数据单元叫做数据报链路层会加头加尾构造帧路由器的链路层会去掉帧头帧尾,还原到网络层数据报再次封装成链路 ...
R语言使用lm函数构建简单线性回归模型（建立线性回归模型）、拟合回归直线、可视化散点图并添加简单线性回归直线、添加模型拟合值数据点、添加拟合值点和实际数据点之间的线段表示残差大小、col参数自定义设置
R语言使用lm函数构建简单线性回归模型(建立线性回归模型).拟合回归直线.可视化散点图并添加简单线性回归直线.添加模型拟合值数据点.添加拟合

python 拟合分布_stats模型中数据的Poisson分布拟合

python 拟合分布_stats模型中数据的Poisson分布拟合相关推荐

最新文章

热门文章