Python拟合数据样本的分布
安装fitter
pip install fitter
生成一段模拟数据
from scipy import stats
import numpy as np
# N(0,2)+N(0,10)
data1 = list(stats.norm.rvs(loc=0, scale=2, size=70000))
data2 = list(stats.norm.rvs(loc=0, scale=20, size=30000))
data=np.array(data1+data2)
利用fitter拟合数据样本的分布
from fitter import Fitter
# may take some time since by default, all distributions are tried
# but you call manually provide a smaller set of distributions
f = Fitter(data, distributions=['norm', 't', 'laplace'])
f.fit()
f.summary()
以上输出为拟合的误差与拟合的概率密度曲线及数据的直方图。
方法详解
Fitter方法
Fitter(data, xmin=None, xmax=None, bins=100, distributions=None, verbose=True, timeout=10)
参数:
data (list) –输入的样本数据;
xmin (float) – 如果为None,则使用数据最小值,否则将忽略小于xmin的数据;
xmax (float) – 如果为None,则使用数据最大值,否则将忽略大于xmin的数据;
bins (int) – 累积直方图的组数,默认=100;
distributions (list) – 给出要查看的分布列表。 如果没有,则尝试所有的scipy分布(80种),常用的分布distributions=[‘norm’,‘t’,‘laplace’,‘cauchy’, ‘chi2’,’ expon’, ‘exponpow’, ‘gamma’,’ lognorm’, ‘uniform’];
verbose (bool) –
timeout – 给定拟合分布的最长时间,(默认=10s) 如果达到超时,则跳过该分布。
Fitter返回
f.summary() #返回排序好的分布拟合质量(拟合效果从好到坏),并绘制数据分布和Nbest分布
f.df_errors #返回这些分布的拟合质量(均方根误差的和)
f.fitted_param #返回拟合分布的参数
f.fitted_pdf #使用最适合数据分布的分布参数生成的概率密度
f.get_best(method='sumsquare_error') #返回最佳拟合分布及其参数
f.hist() #绘制组数=bins的标准化直方图
f.plot_pdf(names=None, Nbest=3, lw=2) #绘制分布的概率密度函数
from fitter import Fitter
import numpy as nparr = np.arange(1, 200)
np.random.shuffle(arr) # arr为创建的随机数fitter_dis = Fitter(arr)
fitter_dis.fit()
distribution_df = fitter_dis.summary() # 这里可以得到error最小的Dataframe型数据
Python拟合数据样本的分布相关推荐
- Python fitter包:拟合数据样本的分布
Python fitter包:拟合样本数据的分布 安装fitter 生成一段模拟数据 利用fitter拟合数据样本的分布 方法详解 Fitter方法 Fitter返回 参考 安装fitter pip ...
- python组合数据分类_Python解决数据样本类别分布不均衡问题
所谓不平衡指的是:不同类别的样本数量差异非常大. 数据规模上可以分为大数据分布不均衡和小数据分布不均衡.大数据分布不均衡:例如拥有1000万条记录的数据集中,其中占比50万条的少数分类样本便于属于这种 ...
- 学习记录609@python实现数据样本的过采样与欠采样
对于分类数据集而言,往往类别会有比较大的差异,比如分析贷款逾期的数据,往往没有逾期的数据远远大于逾期的数据,因此样本会存在不均衡的情况,这样对于数据的训练不利,因此可以使用某些方法对数据集进行调整,分 ...
- Python Fitter 判断数据样本的分布函数拟合
Python fitter包:拟合数据样本的分布 安装fitter Fitter方法参数详解 HistFit类:适合密度函数本身 Python拟合数据样本的分布 github项目:https://gi ...
- python拟合统计分布_利用 Python Fitter 判断数据样本符合那种分布函数
# Python拟合数据样本的分布 # 安装fitter # pip install fitter # 生成一段模拟数据 from scipy import stats import numpy as ...
- python方差选择样本_两个样本方差比的分布(来自Python的实验)
模拟结果图 按照两个样本方差比分布的理论推导可以得到 这里 为样本方差, 为总体方差. 这里将对这一结论进行基于Python的计算机模拟.代码如下. 1 生成两个总体,总体1服从正态分布 ,总体2服从 ...
- 使用Python进行数据拟合
使用Python进行数据拟合 文章目录 使用Python进行数据拟合 多项式拟合 非多项式拟合 多项式拟合 任何一个函数都可以拆分成近似于这个函数的多项式表达. 多项式拟合需要用到的函数是numpy库 ...
- pandas数据预处理(标准化归一化、离散化/分箱/分桶、分类数据处理、时间类型数据处理、样本类别分布不均衡数据处理、数据抽样)
1. 数值型数据的处理 1.1 标准化&归一化 数据标准化是一个常用的数据预处理操作,目的是处理不同规模和量纲的数据,使其缩放到相同的数据区间和范围,以减少规模.特征.分布差异等对模型的影响. ...
- python数据处理2: 拟合数据、整合数据、导出数据
目录 目标 软件 教程 实现 导入库函数 定义拟合函数 拟合数据 获得拟合曲线 数据可视化绘图 效果 数据合并 数据导出 总结 参考 目标 继python数据处理1: 导入数据.片选数据.数据绘图,采 ...
最新文章
- Linux TC(Traffic Control)框架原理解析
- react+dva+antd接口调用方式
- a^logbx=x^logba
- 01_Weblogic课程之概念篇:代理服务器,web服务器,应用程序服务器,JNDI概念,JTA概念,Java消息服务,Java验证和授权(JAAS),Java管理扩展,Web客户机,客户机应用程序
- TypeScript--泛型
- Java 8中的功能接口是什么? @功能注释和示例
- Tomcat访问日志详细配置
- session和cookie的区别和联系详解,Cookie Session相关看这篇就够了。
- 27 log4j2发送Syslog日志出现乱码错误
- Python SPSS教程
- uniapp 树组件 可设置展开层级 可设置回显内容 可设置单选多
- CP的mgmt_cli tool与SMC CLI用法
- Nginx搭建虚拟域名
- Android 根据应用内选择时间调整TextClock时区
- php网页 背景图片,CSS实现网页背景图片自适应全屏详解
- 创建facebook_我如何重新创建Facebook的微交互以进行功能发现
- 检验方法的验证、确认步骤及详细计算方法
- 【杂谈】什么文章可以给有三AI投稿?你能得到什么
- 华为云服务器双十一报价表出炉最新内容
- 在农业道路上越扎越深,拼多多看到了什么?
热门文章
- 面试题编程题06-python 输入一个字符串,反转输出
- Asp.net 不安全端口 解决chrome浏览器访问时提示:ERR_UNSAFE_PORT
- 【排序】冒泡排序算法
- mysql之mysqldump备份恢复
- AMD:浏览器中的模块规范
- CCIE实验之路由重分布之重分布的原则
- 如何确定SharePoint 2007的一次增量爬网会处理多少条更新呢?
- JDBC+Servlet+JSP整合开发之30-JDBC、Servlet、JSP的MVC
- VC中使用Matlab Engine出现无法找到libeng.dll的问题
- SPI 的主模式和从模式