安装fitter

pip install fitter

生成一段模拟数据

from scipy import stats
import numpy as np
# N(0,2)+N(0,10)
data1 = list(stats.norm.rvs(loc=0, scale=2, size=70000))
data2 = list(stats.norm.rvs(loc=0, scale=20, size=30000))
data=np.array(data1+data2)

利用fitter拟合数据样本的分布

from fitter import Fitter
# may take some time since by default, all distributions are tried
# but you call manually provide a smaller set of distributions
f = Fitter(data, distributions=['norm', 't', 'laplace'])
f.fit()
f.summary()


以上输出为拟合的误差与拟合的概率密度曲线及数据的直方图。

方法详解

Fitter方法

Fitter(data, xmin=None, xmax=None, bins=100, distributions=None, verbose=True, timeout=10)

参数:
data (list) –输入的样本数据;
xmin (float) – 如果为None,则使用数据最小值,否则将忽略小于xmin的数据;
xmax (float) – 如果为None,则使用数据最大值,否则将忽略大于xmin的数据;
bins (int) – 累积直方图的组数,默认=100;
distributions (list) – 给出要查看的分布列表。 如果没有,则尝试所有的scipy分布(80种),常用的分布distributions=[‘norm’,‘t’,‘laplace’,‘cauchy’, ‘chi2’,’ expon’, ‘exponpow’, ‘gamma’,’ lognorm’, ‘uniform’];
verbose (bool) –
timeout – 给定拟合分布的最长时间,(默认=10s) 如果达到超时,则跳过该分布。

Fitter返回

f.summary() #返回排序好的分布拟合质量(拟合效果从好到坏),并绘制数据分布和Nbest分布
f.df_errors #返回这些分布的拟合质量(均方根误差的和)
f.fitted_param #返回拟合分布的参数
f.fitted_pdf #使用最适合数据分布的分布参数生成的概率密度
f.get_best(method='sumsquare_error') #返回最佳拟合分布及其参数
f.hist() #绘制组数=bins的标准化直方图
f.plot_pdf(names=None, Nbest=3, lw=2) #绘制分布的概率密度函数
from fitter import Fitter
import numpy as nparr = np.arange(1, 200)
np.random.shuffle(arr) # arr为创建的随机数fitter_dis = Fitter(arr)
fitter_dis.fit()
distribution_df = fitter_dis.summary() # 这里可以得到error最小的Dataframe型数据

Python拟合数据样本的分布相关推荐

  1. Python fitter包:拟合数据样本的分布

    Python fitter包:拟合样本数据的分布 安装fitter 生成一段模拟数据 利用fitter拟合数据样本的分布 方法详解 Fitter方法 Fitter返回 参考 安装fitter pip ...

  2. python组合数据分类_Python解决数据样本类别分布不均衡问题

    所谓不平衡指的是:不同类别的样本数量差异非常大. 数据规模上可以分为大数据分布不均衡和小数据分布不均衡.大数据分布不均衡:例如拥有1000万条记录的数据集中,其中占比50万条的少数分类样本便于属于这种 ...

  3. 学习记录609@python实现数据样本的过采样与欠采样

    对于分类数据集而言,往往类别会有比较大的差异,比如分析贷款逾期的数据,往往没有逾期的数据远远大于逾期的数据,因此样本会存在不均衡的情况,这样对于数据的训练不利,因此可以使用某些方法对数据集进行调整,分 ...

  4. Python Fitter 判断数据样本的分布函数拟合

    Python fitter包:拟合数据样本的分布 安装fitter Fitter方法参数详解 HistFit类:适合密度函数本身 Python拟合数据样本的分布 github项目:https://gi ...

  5. python拟合统计分布_利用 Python Fitter 判断数据样本符合那种分布函数

    # Python拟合数据样本的分布 # 安装fitter # pip install fitter # 生成一段模拟数据 from scipy import stats import numpy as ...

  6. python方差选择样本_两个样本方差比的分布(来自Python的实验)

    模拟结果图 按照两个样本方差比分布的理论推导可以得到 这里 为样本方差, 为总体方差. 这里将对这一结论进行基于Python的计算机模拟.代码如下. 1 生成两个总体,总体1服从正态分布 ,总体2服从 ...

  7. 使用Python进行数据拟合

    使用Python进行数据拟合 文章目录 使用Python进行数据拟合 多项式拟合 非多项式拟合 多项式拟合 任何一个函数都可以拆分成近似于这个函数的多项式表达. 多项式拟合需要用到的函数是numpy库 ...

  8. pandas数据预处理(标准化归一化、离散化/分箱/分桶、分类数据处理、时间类型数据处理、样本类别分布不均衡数据处理、数据抽样)

    1. 数值型数据的处理 1.1 标准化&归一化 数据标准化是一个常用的数据预处理操作,目的是处理不同规模和量纲的数据,使其缩放到相同的数据区间和范围,以减少规模.特征.分布差异等对模型的影响. ...

  9. python数据处理2: 拟合数据、整合数据、导出数据

    目录 目标 软件 教程 实现 导入库函数 定义拟合函数 拟合数据 获得拟合曲线 数据可视化绘图 效果 数据合并 数据导出 总结 参考 目标 继python数据处理1: 导入数据.片选数据.数据绘图,采 ...

最新文章

  1. Linux TC(Traffic Control)框架原理解析
  2. react+dva+antd接口调用方式
  3. a^logbx=x^logba
  4. 01_Weblogic课程之概念篇:代理服务器,web服务器,应用程序服务器,JNDI概念,JTA概念,Java消息服务,Java验证和授权(JAAS),Java管理扩展,Web客户机,客户机应用程序
  5. TypeScript--泛型
  6. Java 8中的功能接口是什么? @功能注释和示例
  7. Tomcat访问日志详细配置
  8. session和cookie的区别和联系详解,Cookie Session相关看这篇就够了。
  9. 27 log4j2发送Syslog日志出现乱码错误
  10. Python SPSS教程
  11. uniapp 树组件 可设置展开层级 可设置回显内容 可设置单选多
  12. CP的mgmt_cli tool与SMC CLI用法
  13. Nginx搭建虚拟域名
  14. Android 根据应用内选择时间调整TextClock时区
  15. php网页 背景图片,CSS实现网页背景图片自适应全屏详解
  16. 创建facebook_我如何重新创建Facebook的微交互以进行功能发现
  17. 检验方法的验证、确认步骤及详细计算方法
  18. 【杂谈】什么文章可以给有三AI投稿?你能得到什么
  19. 华为云服务器双十一报价表出炉最新内容
  20. 在农业道路上越扎越深,拼多多看到了什么?

热门文章

  1. 面试题编程题06-python 输入一个字符串,反转输出
  2. Asp.net 不安全端口 解决chrome浏览器访问时提示:ERR_UNSAFE_PORT
  3. 【排序】冒泡排序算法
  4. mysql之mysqldump备份恢复
  5. AMD:浏览器中的模块规范
  6. CCIE实验之路由重分布之重分布的原则
  7. 如何确定SharePoint 2007的一次增量爬网会处理多少条更新呢?
  8. JDBC+Servlet+JSP整合开发之30-JDBC、Servlet、JSP的MVC
  9. VC中使用Matlab Engine出现无法找到libeng.dll的问题
  10. SPI 的主模式和从模式