CDF是什么?简单对概率分布函数进行一个描述,在概率论中要研究一个随机变量ξ取值小于某一数值x的概率,这概率是x的函数,称这种函数为随机变量ξ的分布函数。
F ( x ) = P ( X < x ) , F ( + ∞ ) = 1 , F ( − ∞ ) = 0 F(x)=P(X<x),F(+\infin)=1,F(-\infin)=0 F(x)=P(X<x),F(+∞)=1,F(−∞)=0

CDF对机器学习有什么用?可以非常直观地对预测误差进行分析,可以判断出当误差为某个值时的具体概率是多少,以该图像指标为基础为后续的优化和改进做铺垫。


现在有一个样本序列 l i s t = [ x 1 , x 2 , . . . , x n ] list=[x_1,x_2,...,x_n] list=[x1​,x2​,...,xn​],要用Python将其分布函数绘制出来,实现如下:

import matplotlib.pyplot as plt
import numpy as np
已知样本序列ds,是以list[...]的形式存在的,首先对ds进行排序
ds_sort = sorted(ds)
last, i = min(ds_sort), 0
while i < len(ds_sort):plt.plot([last, ds_sort[i]], [i/len(ds_sort), i/len(ds_sort)], c='k', lw=2.5)if i < len(ds_sort):last = ds_sort[i]i += 1
plt.grid()
plt.show()

最终绘制出来的图像如下:

直观分析,x小于等于20的概率大约是0.95,x小于等于40的概率大约是1。根据这个分布,可以说几乎所有样本分布在横坐标前40的区间内。
在这个例子中,我用的list本身是在机器学习中预测值与真实值之间的误差,这个分布可以直观地对预测误差进行分析,可以判断出误差为某个值时的具体概率是多少,以便后续的优化和改进。

参考资料:

  • 百度百科-概率分布函数
  • 用Python画出一组样本的经验分布函数

【数据挖掘】Python绘制一组样本的CDF概率分布函数(经验分布函数)相关推荐

  1. 【Python】数理统计理论:常用统计量、经验分布函数

    一.常用统计量 数理统计学中常用的统计量有:样本均值.样本方差.顺序统计量.中位数.众数等. 其中可以反映总体位置特征的有数据的中心位置是均值(Mean),中位数(Median),众数(Mode).其 ...

  2. python统计一组数据中的概率_Python实现概率分布

    一.概率分布 概率分布,是概率论的基本概念之一,主要用以表述随机变量取值的概率规律.为了使用的方便,根据随机变量所属类型的不同,概率分布取不同的表现形式. 概率分布包括离散概率分布和连续概率分布. 离 ...

  3. 概率统计Python计算:样本数据的经验分布函数

    设 ( x 1 , x 2 , ⋯ , x n ) (x_1,x_2,\cdots,x_n) (x1​,x2​,⋯,xn​)是总体 X X X的一个样本观测值.与绘制直方图相仿,记 a = m i n ...

  4. Python计算一组数据的PDF(概率密度函数)方法

    Python计算一组数据的PDF(概率密度函数)方法 公式如下: python实现: 第一种方法: import scipy.stats as stst.norm.pdf([一组数据]) 第二种方法: ...

  5. python绘制概率密度曲线_python添加概率密度曲线-女性时尚流行美容健康娱乐mv-ida网...

    自动秒收录 如何加入 (当前页) 购买本站源码 自媒体交流 查询是否收录 查询收录 × 快速加入 只要做上本站的友情链接,并在您站上点击一次,就免人工自动收录!并自动排在本站第一位. 本站已收录286 ...

  6. python绘制散点图:二分类样本

    在做机器学习数据集的探索时,需要绘制二变量的散点图,散点图要能够区分正负样本. 如何用python绘制散点图呢?思路其实不复杂: 1.绘制正样本,使用"+"图标 2.在同一张图上绘 ...

  7. caffe版本frcnn的 ROC,AUC,PR,AP介绍及python绘制

    这里介绍一下如题所述的四个概念以及相应的使用python绘制曲线: 参考博客:使用Python画ROC曲线以及AUC值 一般我们在评判一个分类模型的好坏时,一般使用MAP值来衡量,MAP越接近1,模型 ...

  8. 机器学习:python绘制P-R曲线与ROC曲线

    Python绘制P-R曲线与ROC曲线 查准率与查全率 P-R曲线的绘制 ROC曲线的绘制 查准率与查全率   P-R曲线,就是查准率(precision)与查全率(recall)的曲线,以查准率作为 ...

  9. python 投票计数器_大数据分析Python有哪些计数器类和概率质量函数

    Python Counter类 大数据分析Python有哪些计数器类和概率质量函数,Python中的Counter类是collections模块的一部分.计数器提供了一种快速的方法来计算列表中存在的唯 ...

最新文章

  1. 腾讯笔试题 如下代码,result变量的输出结果是多少
  2. python中文件读写位置的作用-Python中文件的读写
  3. xp 设备管理器 android,XP设备管理器怎么打开?
  4. oracle实验六杨艳华_oracle实验报告总结
  5. hibernate 简单笔记(一)
  6. 顺序程序设计02 - 零基础入门学习C语言08
  7. php传值到模板,thinkphp模板传值
  8. 在datasnap 中使用unidac 访问数据(客户端)
  9. MySQL存储过程 — 解析 XML 数据并实现插入操作
  10. 一般将来时语法课教案_优秀教案人教版必修二Unit2——语法专题课训练
  11. raid5用户mbr还是gpt_系统硬盘gpt转换的操作方法
  12. 2021必看!java电子书合集,值得收藏!
  13. 数据仓库需求分析指南
  14. 【Edge浏览器】插件安装失败[Download Interrupt]
  15. 大学英语综合教程四 Unit 5 课文内容英译中 中英翻译
  16. Jenkins流水线部署java项目
  17. 多边形区域填充算法--扫描线种子填充算法
  18. jq onclick 定义_jquery onclick函数未定义(jquery onclick function not defined)
  19. 分布式系统架构与分布式事务十问十答,小伙伴们赶快收藏吧
  20. 数据库常考选择题合集

热门文章

  1. 计算机有关书籍学习与推荐
  2. matlab绘图学习(绘制图形的辅助操作)
  3. 用两条命令看出你买的H3C光模块是否是正品
  4. 在idea中如何导入一个已有的项目
  5. hive 计算周几_hive返回星期几的方法
  6. 奇异值分解的定义及应用
  7. 从零开始掌握Python机器学习:七步教程 基础篇
  8. 苏菲兔子和魔法师小麦
  9. 关闭vscode链接检查,去掉VSCODE 编辑器的链接下划线
  10. Java----映射 map