calibration_curve

运行完得出的分类结果是不是满足独立同分布,分类概率prob,可以用最大似然假设?那么概率校准calibration_curve,用Isotonic regression,得出calibration_curve的好坏,用交叉熵检验,和方差,及使用朴素贝叶斯方法

交叉熵检验,logistics回归
对数损失, 即对数似然损失(Log-likelihood Loss), 也称逻辑斯谛回归损失(Logistic Loss)或交叉熵损失(cross-entropy Loss), 是在概率估计上定义的.它常用于(multi-nominal, 多项)逻辑斯谛回归和神经网络,以及一些期望极大算法的变体. 可用于评估分类器的概率输出.

Isotonic regression–保序回归
概率校准 calibration_curve(更新)
对数损失函数(Logarithmic Loss Function)的原理和 Python 实现
一文搞懂熵(Entropy),交叉熵(Cross-Entropy)

贝叶斯


机器学习—— 朴素贝叶斯分类器
朴素贝叶斯Naive Bayes:
“属性条件独立性假设”(attribute conditional independence assumption)

Dnb = argmax p(Dj) ∏p(hi|Dj) = argmax [ log P(Dj) + ∑ log p(hi|Dj) ]
i Dj i

对于极大后验假设MAP,p(Dj)穷举所有可能,使用全概率公式,p(Dj)为缩放因子,可忽略不计
k
hMAP = argmax p(h|D) = p(h=hi)p(D|h = hi) / ∑ p(h=hi)p(D|h=hi)
h∈H i

hMAP = argmax p(D|h)p(h) / p(D) = argmax p(D|h)p(h)
h∈H h∈H

当MAP满足独立性条件时,为朴素贝叶斯Naive Bayes
p(h1, h2, h3…hi|Dj) = ∏p(hi|Dj)
i

对于极大似然假设,满足“完全不知道假设,或者知道所有的假设发生概率相同”,即满足知道p(h(Xi)),或者p(h(Xi))对于不同Xi服从的分布独立同分布即得到p(h(Xi))服从均匀分布
hML= argmax p(D|h)
h∈H



对于每一个Xi,属于一个正态分布,对于整个离散数据集,每个Xi满足独立同分布,它们整体的均值的均值为u,均值的方差为σ,满足

即对于每一个噪声点,属于一个正态分布,对于整个噪声离散数据集,每个噪声点满足独立同分布,它们整体的均值的均值为0,均值的方差为σ,满足N(0,σ2)

符合中心极限定理的假设:

那么对于样本,或者由样本特征工程构造的特征X1,X2…Xn,如果X1的分布与X2的分布与Xn的分布之间相互独立且相同(满足独立同分布条件),则p(h(Xi))服从均匀分布,即满足“完全不知道假设,或者知道所有的假设发生概率相同”,即满足最大似然假设,那么可以通过此方法构建样本

多元高斯分布完全解析

对于0、1分类:
从朴素贝叶斯定理来说,
一个人有没有患有特定癌症:

同时,一个人有没有患癌症还受到其他因子影响,如是否饮食不健康,家族是否有遗传因素,遗传因素有几种,是否抽烟,等等,这些因子与实验结果为正或者负,共同推出一个人是否患有癌症;

“判别式模型” (discriminative models)
判别式模型直接学习决策函数Y=f(x)或者条件概率 P(Y|X),不能反映训练数据本身的特性,但它寻找不同类别之间的最优分裂面,反映的是异类数据之间的差异,直接面对预测往往学习准确度更高。
判别式模型:要确定一个羊是山羊还是绵羊,用判别式模型的方法是从历史数据中学习到模型,然后通过提取这只羊的特征来预测出这只羊是山羊的概率,是绵羊的概率。
“生成式模型” (generative models)
生成式模型学习的是联合概率密度分布 P(X,Y),可以从统计的角度表示分布的情况,能够反映同类数据本身的相似度,它不关心到底划分不同类的边界在哪里。生成式模型的学习收敛速度更快,当样本容量增加时,学习到的模型可以更快的收敛到真实模型,当存在隐变量时,依旧可以用生成式模型,此时判别式方法就不行了。
生成式模型:是根据山羊的特征首先学习出一个山羊的模型,然后根据绵羊的特征学习出一个绵羊的模型,然后从这只羊中提取特征,放到山羊模型中看概率是多少,再放到绵羊模型中看概率是多少,哪个大就是哪个。
联系:判断依据都是条件概率P(y|x),但是生成式模型先计算了联合概率,再由贝叶斯公式计算得到条件概率。因此,生成式模型可以体现更多数据本身的分布信息,其普适性更广。
https://zhuanlan.zhihu.com/p/74586507
https://blog.csdn.net/weixin_42615847/article/details/127603081

https://qn1-next.xuetangonline.com/16551827061432.zip?attname=机器学习课件最终版PDF合集%20%203.zip

概率校准calibration_curve,用Isotonic regression,得出calibration_curve的好坏,用交叉熵检验,和方差,及使用朴素贝叶斯方法相关推荐

  1. 《贝叶斯方法:概率编程与贝叶斯推断》一导读

    前 言 贝叶斯方法:概率编程与贝叶斯推断 贝叶斯方法是一种常用的推断方法,然而对读者来说它通常隐藏在乏味的数学分析章节背后.关于贝叶斯推断的书通常包含两到三章关于概率论的内容,然后才会阐述什么是贝叶斯 ...

  2. svc预测概率_机器学习朴素贝叶斯 SVC对新闻文本进行分类

    朴素贝叶斯分类器模型(Naive Bayles) Model basic introduction: 朴素贝叶斯分类器是通过数学家贝叶斯的贝叶斯理论构造的,下面先简单介绍贝叶斯的几个公式: 先验概率: ...

  3. 机器学习之朴素贝叶斯(一):朴素贝叶斯的介绍、概率基础(拉普拉斯平滑)、sklearn朴素贝叶斯实现API、朴素贝叶斯分类的优缺点、文本的特征工程

    朴素贝叶斯 文章目录 朴素贝叶斯 一.介绍 1.1 文本分类的应用 词云的例子 垃圾邮件分类 文章类别的概率 二.概率基础 2.1 概率例题 2.2 联合概率和条件概率 2.3 朴素贝叶斯-贝叶斯公式 ...

  4. 【AI数学原理】概率机器学习(四):半朴素贝叶斯之TAN算法实例

    概率机器学习的系列博文已经写到第四篇了,依然关注者乏.虽说来只是自己的学习记录,不过这样下去显得自己贡献值比较低下.于是今天换一种模式来写博文--结合代码实现. 欢迎各位指点交流~ 预备知识: 1.朴 ...

  5. 朴素贝叶斯算法概率相关概念

    贝叶斯原理是英国数学家托马斯·贝叶斯于18 世纪提出的,当我们不能直接计算一件事情(A)发生的可能性大小的时候,可以间接的计算与这件事情有关的事情(X,Y,Z)发生的可能性大小,从而间接判断事情(A) ...

  6. python基于朴素贝叶斯模型的预测概率和标签信息可视化ROC曲线

    python基于朴素贝叶斯模型的预测概率和标签信息可视化ROC曲线 目录 python基于朴素贝叶斯模型的预测概率和标签信息可视化ROC曲线

  7. 朴素贝叶斯基本原理和预测过程、先验概率、后验概率、似然概率概念

    贝叶斯原理是英国数学家托马斯·贝叶斯提出的. 贝叶斯原理 建立在主观判断的基础上:在我们不了解所有客观事实的情况下,同样可以先估计一个值,然后根据实际结果不断进行修正. 举例: 一个袋子里有10个球, ...

  8. 为机器学习爱好者推荐一本书《贝叶斯方法:概率编程与贝叶斯推断》

    本书的内容特色: 学习贝叶斯思维方式 ·理解计算机如何进行贝叶斯推断 ·利用PyMC Python库进行编程来实现贝叶斯分析 ·利用PyMC建模以及调试 ·测试模型的拟合优度 ·打开马尔科夫链蒙特卡洛 ...

  9. python朴素贝叶斯回归预测的结果全是1_python – 朴素贝叶斯概率总是1

    我开始使用sklearn.naive_bayes.GaussianNB进行文本分类,并且获得了很好的初始结果.我想使用分类器返回的概率作为置信度的度量,但predict_proba()方法总是为所选类 ...

最新文章

  1. 2019第十二届“认证杯”数学建模(第二阶段)
  2. 新课标下计算机教学,浅析新课程标准下小学信息技术教学
  3. 从HttpServletRequest获取完整的请求路径
  4. Keras处理TIFF图像
  5. c#listbox使用详解和常见问题解决
  6. x264编码参数大测试:05 subme与crf(g)
  7. 听说去了BAT的 Linuxers 都做过这套面试题!
  8. psp java运行环境_手机模拟器?PSP的Java环境PSPKVM 0.0.7发布
  9. 7450清零_兄弟MFC-7450打印机硒鼓加粉 兄弟MFC-7450打印机怎么清零【图文】
  10. MTK功能机2503 GPIO配置
  11. html单元格加斜线,怎样在表格中加斜线 选中第一个单元格,进入下一步
  12. mysql cluster部署_mysql cluster部署
  13. 数学建模基础理论【二】(定积分)
  14. Python Django支付宝沙箱调试
  15. Android手机电池耐用吗,八款超长待机的智能手机 大容量电池十分耐用
  16. 了解【泰科】协作机器人产品资料大全
  17. 计算机基础1杨石答案第五章,计算机基础课程教学改革与实践
  18. 大数据基础习题(2)
  19. 圆珠笔芯为什么那么细
  20. 论文:回声消除中的LMS和NLMS算法与MATLAB实现

热门文章

  1. 探访上汽通用武汉奥特能超级工厂
  2. 《RFID技术与应用》测试选择题
  3. MapReduce优劣,理解MapReduce与Hadoop
  4. Jmeter中线程组对Sampler和对循环控制器的作用
  5. PTA 7-2 复数计算
  6. 苹果动态壁纸库怎么增加_苹果xr如何添加动态壁纸设置
  7. 因果推断杂记——因果推断与线性回归、SHAP值理论的关系(十九)
  8. JavaScript头像图片上传插件支持上传类型大小尺寸验证
  9. .c文件和.h文件之间的联系
  10. 阿里云,华为云哪个更好?