在机器学习中,platt scaling 或者 platt calibration 是把模型的输出转化成一种基于类别的概率分布的方法。这个方法代替了早期的Vapnik提出的方法,但是这个方法可以应用于其他的分类模型。platt是把一个逻辑回归模型拟合分类分数的方法。

在二分类中,对于输入x,我们想要知道它属于两类中的哪一类,我们假定这个分类任务可以用一个函数f解决,预测y=sign(f(x)),对于many问题,很方便获得P(y=1|x),例如一个分类器不仅给出预测的结果,而且给出置信度。但是有的模型却没有给出。

platt scaling 是一个解决上述问题的算法:

对分类的分数f(x)进行了逻辑回归转化,A和B是分类器学习得到的两个参数。转化后,由P(y=1|x)>0.5

可以预测y=1,如果B不等于0,和之前的y=sign(f(x))相比,概率估计包含了一个纠正项,

使用最大似然法估计A和B,和分类器f用同样的训练集,为了防止过拟合,可以保留calibration set 或者使用交叉验证,并且应该把标签y转化成目标概率:

N+和N-分别表示正样本和负样本的个数,This transformation follows by applying Bayes' rule to a model of out-of-sample data that has a uniform prior over the labels.[1]

Platt scaling相关推荐

  1. 几种经典概率校准方法(Platt scaling、 histogram binning、 isotonic regression、 temperature scaling)

    1. Platt scaling Platt scaling本质上是对模型sigmoid输出的分数做概率变化.在此基础上引入了两个参数a, b,假设输入样本为$X_i$,模型输出分数为$f(X_i)$ ...

  2. 2020年,图机器学习的趋势有哪些?

    关注上方"深度学习技术前沿",选择"星标公众号", 资源干货,第一时间送达! 2020 年已经过去了2个多月,但我们已经可以从最近的研究论文中一窥图机器学习(G ...

  3. 机器学习笔记(八)集成学习

    8.集成学习 8.1个体与集成 集成学习(ansemblelearning)通过构建并结合多个学习器来完成学习任务,也称为多分类器系统(multi-classifiersystem).基于委员会的学习 ...

  4. smote算法_支持向量机算法的可解释和可视化

    SVM通常被认为是"黑匣子".在本文中,我们将介绍可视化学习的SVM模型及其在真实世界数据上的性能的技术. 本文包含以下部分: 线性模型,SVM和内核简介 利用SVM内核解释高维特 ...

  5. 【Scikit-Learn 中文文档】支持向量机 - 监督学习 - 用户指南 | ApacheCN

    中文文档: http://sklearn.apachecn.org/cn/0.19.0/modules/svm.html 英文文档: http://sklearn.apachecn.org/en/0. ...

  6. 2020年,图机器学习将走向何方?

    点击我爱计算机视觉标星,更快获取CVML新技术 本文转载自机器之心. 选自towardsdatascience 作者:Sergei Ivanov 机器之心编译 参与:魔王.杜伟 2020 年已经过去了 ...

  7. [PMLR 2017] On calibration of modern neural networks

    Contents Introduction Calibration Metrics Observing Miscalibration Calibration Methods Calibrating B ...

  8. 我们如何在Pinterest Ads中使用AutoML,多任务学习和多塔模型

    Ernest Wang | Software Engineer, Ads Ranking 欧内斯特·王| 软件工程师,广告排名 People come to Pinterest in an explo ...

  9. 监督分类:SVM即支持向量机实现遥感影像监督分类(更新:添加机器学习模型存储、大影像划框拼接)

    前面已经有一个版本了,但是影像太大内存顶不住,而且训练和预测没有分离,后面批量用这个不可能每次每张影像都训练了再预测,这次正好有需求,我就最后把这个整理一下,算是终版吧,以后也不会再花时间整这个了 这 ...

最新文章

  1. 年底送点福利,包邮送55本!Python、大数据、人工智能任你挑!
  2. 蜘蛛通过哪些内容评判网站质量高低?
  3. 电脑显示器变色_流光溢彩电竞出击:飞利浦猛腾M1系列电竞显示器275M1RZ
  4. Rulo扫地机器人app_扫地机器人怎么选?扫地机器人怎么用
  5. SQL Server 2000优化SELECT语句方法
  6. 互联网高级Java面试总结
  7. 查看CentOS系统版本,Linux内核版本,32位还是64位
  8. 快速找出Linux服务器上不该存在恶意或后门文件
  9. 关于MultiActionController异步请求Ajax,pc端正常,手机端报error错误;此问题一般是通过setInterval,seTimeout,做Ajax轮询时会产生此问题;
  10. Android源码学习之环境搭建(Ubuntu下载Android源码)
  11. s鼠标在计算机哪部分里,罗技 G700s鼠标游戏软件详解
  12. RESTClient使用教程
  13. centos usb转网口_Linux环境下使用 USB转串口驱动(一)
  14. python 过采样算法_欠采样(undersampling)和过采样(oversampling)会对模型带来怎样的影响?...
  15. (概论)java web后台开发跟手机APP后台开发有什么不同
  16. 模拟器打开开发者模式
  17. 三级等保 mysql8.0.24密码策略设置
  18. 输入某年某月某日,判断这一天是这一年的第几天?
  19. mui html5 vue,VUE中使用MUI方法
  20. 启舰:不懂花钱的人,大概率成为Loser!

热门文章

  1. k折交叉验证 python_Python实现K折交叉验证法的方法步骤
  2. 想象力的再突破!无人机后还有大招?!
  3. correl函数_教你利用Correl函数返回相关系数并确定属性关系
  4. 抽象类DateFormat
  5. ValueError: cannot resize this array: it does not own its data
  6. sanp 7 1200plc通信
  7. 【分治法】逆序对的数量(结合归并排序,含详细思想、解法、代码及注释)
  8. 数组对头删除php,php学习 数组课件
  9. tar 慢 加快_加快慢的Outlook 2007
  10. 为什么我的同花顺选股服务器列表为空,同花顺选股公式,为什么我就选不出股票来呢数......