分类结果可视化python

I love good data visualizations. Back in the days when I did my PhD in particle physics, I was stunned by the histograms my colleagues built and how much information was accumulated in one single plot.

我喜欢出色的数据可视化。 早在我获得粒子物理学博士学位时,我就被同事建立的直方图以及在一张图中积累了多少信息而感到震惊。

绘图中的信息 (Information in Plots)

It is really challenging to improve existing visualization methods or to transport methods from other research fields. You have to think about the dimensions in your plot and the ways to add more of them. A good example is the path from a boxplot to a violinplot to a swarmplot. It is a continuous process of adding dimensions and thus information.

改善现有的可视化方法或从其他研究领域转移方法确实是一项挑战。 您必须考虑绘图中的尺寸以及添加更多尺寸的方法。 一个很好的例子是从箱形图到小提琴图再到黑线的路径。 这是添加维度和信息的连续过程。

The possibilities of adding information or dimensions to a plot are almost endless. Categories can be added with different marker shapes, color maps like in a heat map can serve as another dimension and the size of a marker can give insight to further parameters.

向地块添加信息或尺寸的可能性几乎是无限的。 可以添加具有不同标记形状的类别,像热图一样的颜色图可以用作另一个维度,标记的大小可以洞察其他参数。

分类器效果图 (Plots of Classifier Performance)

When it comes to machine learning, there are many ways to plot the performance of a classifier. There is an overwhelming amount of metrics to compare different estimators like accuracy, precision, recall or the helpful MMC.

在机器学习方面,有许多方法可以绘制分类器的性能。 有大量指标可以比较不同的估算器,例如准确性,准确性,召回率或有用的MMC。

All of the common classification metrics are calculated from true positive, true negative, false positive and false negative incidents. The most popular plots are definitely ROC curve, PRC, CAP curve and the confusion matrix.

所有常见分类指标都是根据真实肯定,真实否定错误肯定错误否定事件计算的。 最受欢迎的图肯定是ROC曲线,PRC,CAP曲线和混淆矩阵。

I won’t get into detail of the three curves, but there are many different ways to handle the confusion matrix, like adding a heat map.

我不会详细介绍这三个曲线,但是有许多不同的方法来处理混淆矩阵,例如添加热图。

A seaborn heatmap of a confusion matrix.
混淆矩阵的海洋热图。

分类拼接图 (A Classification Mosaic Diagram)

For many cases, this is probably sufficient and easy to pick up all relevant information, but for a multi class problem, it can get much harder to do so.

在许多情况下,这可能足够容易地提取所有相关信息,但是对于多类问题,这样做会变得更加困难。

While reading some papers, I stumbled across:

在阅读一些论文时,我偶然发现:

Jakob Raymaekers, Peter J. Rousseeuw, Mia Hubert. Visualizing classification results. arXiv:2007.14495 [stat.ML]

Jakob Raymaekers,Peter J.Rousseeuw和Mia Hubert。 可视化分类结果。 arXiv:2007.14495 [stat.ML]

and from there to

然后从那里

Friendly, Michael. “Mosaic Displays for Multi-Way Contingency Tables.” Journal of the American Statistical Association, vol. 89, no. 425, 1994, pp. 190–200. JSTOR, www.jstor.org/stable/2291215. Accessed 13 Aug. 2020.

友好,迈克尔。 “多向列联表的马赛克显示。” 美国统计协会杂志 ,第一卷。 89号 425,1994,第190-200页。 JSTOR , www.jstor.org / stable / 2291215。 于2020年8月13日访问。

The authors propose a mosaic diagram to plot discrete values. We can transport this idea to the field of machine learning with the predicted classes as the discrete values.

作者提出了一个马赛克图来绘制离散值。 我们可以将这种思想以预测的类作为离散值传输到机器学习领域。

In a multi class environment, such a plot would look like the following:

在多类环境中,这种绘图如下所示:

Mosaic plot of a classification result with four classes.
具有四个类别的分类结果的镶嵌图。

It has several advantages over a classical confusion matrix. One can easily see the predicted classes on the y-axis and the number proportion of each class on the x-axis. The big difference from a simple bar plot is the width of the bars, which are giving an idea of the class imbalance.

与经典的混淆矩阵相比,它具有多个优点。 可以轻松地在y轴上看到预测的类别,并在x轴上看到每个类别的数量比例。 与简单条形图的最大区别在于条形的宽度,这使人们对类的不平衡有所了解。

You can find the code for such a plot fed with a confusion matrix here:

您可以在此处找到此类代码的代码,其中包含混淆矩阵:

Have fun plotting your next classification results!

祝您规划下一个分类结果愉快!

翻译自: https://towardsdatascience.com/a-different-way-to-visualize-classification-results-c4d45a0a37bb

分类结果可视化python


http://www.taodudu.cc/news/show-995053.html

相关文章:

  • rstudio 管道符号_R中的管道指南
  • 时间序列因果关系_分析具有因果关系的时间序列干预:货币波动
  • 无法从套接字中获取更多数据_数据科学中应引起更多关注的一个组成部分
  • 深度学习数据更换背景_开始学习数据科学的最佳方法是了解其背景
  • 数据中台是下一代大数据_全栈数据科学:下一代数据科学家群体
  • 泰坦尼克数据集预测分析_探索性数据分析-泰坦尼克号数据集案例研究(第二部分)
  • 大数据技术 学习之旅_如何开始您的数据科学之旅?
  • 搜索引擎优化学习原理_如何使用数据科学原理来改善您的搜索引擎优化工作
  • 一件登录facebook_我从Facebook的R教学中学到的6件事
  • python 图表_使用Streamlit-Python将动画图表添加到仪表板
  • Lockdown Wheelie项目
  • 实现klib_使用klib加速数据清理和预处理
  • 简明易懂的c#入门指南_统计假设检验的简明指南
  • python 工具箱_Python交易工具箱:通过指标子图增强图表
  • python交互式和文件式_使用Python创建和自动化交互式仪表盘
  • 无向图g的邻接矩阵一定是_矩阵是图
  • 熊猫分发_熊猫新手:第一部分
  • 队列的链式存储结构及其实现_了解队列数据结构及其实现
  • 水文分析提取河网_基于图的河网段地理信息分析排序算法
  • python 交互式流程图_使用Python创建漂亮的交互式和弦图
  • 最接近原点的 k 个点_第K个最接近原点的位置
  • 熊猫分发_熊猫新手:第二部分
  • 数据分析 绩效_如何在绩效改善中使用数据分析
  • 您一直在寻找5+个简单的一线工具来提升Python可视化效果
  • 产品观念:更好的捕鼠器_故事很重要:为什么您需要成为更好的讲故事的人
  • 面向Tableau开发人员的Python简要介绍(第2部分)
  • netflix_Netflix的计算因果推论
  • 高斯金字塔 拉普拉斯金字塔_金字塔学入门指南
  • 语言认知偏差_我们的认知偏差正在破坏患者的结果数据
  • python中定义数据结构_Python中的数据结构。

分类结果可视化python_可视化分类结果的另一种方法相关推荐

  1. R语言ggplot2可视化:可视化离散(分类)变量的堆叠的柱状图、横轴是离散变量、柱状图是多个分组的计数和叠加

    R语言ggplot2可视化:可视化离散(分类)变量的堆叠的柱状图.横轴是离散变量.柱状图是多个分组的计数和叠加 目录

  2. seaborn可视化多水平分类变量分组箱图boxplot并自定义多个箱体的顺序(Manually Order Boxes in Boxplot with Seaborn)

    seaborn可视化多水平分类变量分组箱图boxplot并自定义多个箱体的顺序(Manually Order Boxes in Boxplot with Seaborn) 目录

  3. R语言配对图可视化:配对图(pair plot)可视化(根据分类变量的值为散点图上的数据点添加颜色和形状、Add color and shape by variables)

    R语言配对图可视化:配对图(pair plot)可视化(根据分类变量的值为散点图上的数据点添加颜色和形状.Add color and shape by variables) 目录

  4. R语言WVPlots包可视化克利夫兰点ClevelandDotPlot、并按照分类变量排序进行可视化克利夫兰点ClevelandDotPlot

    R语言WVPlots包可视化克利夫兰点ClevelandDotPlot.并按照分类变量排序进行可视化克利夫兰点ClevelandDotPlot 目录 WVPlots包可视化克利夫兰点Cleveland ...

  5. R语言创建自定义颜色(分类变量与颜色形成稳定映射)实战:设置因子变量(分类变量)到可视化颜色的稳定映射

    R语言创建自定义颜色(分类变量与颜色形成稳定映射)实战:设置因子变量(分类变量)到可视化颜色的稳定映射 目录

  6. ML:基于自定义数据集利用Logistic、梯度下降算法GD、LoR逻辑回归、Perceptron感知器、SVM支持向量机、LDA线性判别分析算法进行二分类预测(决策边界可视化)

    ML:基于自定义数据集利用Logistic.梯度下降算法GD.LoR逻辑回归.Perceptron感知器.支持向量机(SVM_Linear.SVM_Rbf).LDA线性判别分析算法进行二分类预测(决策 ...

  7. ML之xgboost:基于xgboost(5f-CrVa)算法对HiggsBoson数据集(Kaggle竞赛)训练(模型保存+可视化)实现二分类预测

    ML之xgboost:基于xgboost(5f-CrVa)算法对HiggsBoson数据集(Kaggle竞赛)训练(模型保存+可视化)实现二分类预测 目录 数据集简介 输出结果 设计思路 核心代码 数 ...

  8. 论文图片绘制 Python绘制多分类混淆矩阵及可视化(颜色随正确率渐变)

    论文图片绘制 Python绘制duofenlei 混淆矩阵及可视化(颜色随正确率渐变) 需求 论文中对多分类评价需要 混淆矩阵已获得,需要可视化 给出数据 混淆矩阵的定义以及如何读图不再描述,这里仅给 ...

  9. 数据分享|PYTHON用决策树分类预测糖尿病和可视化实例

    全文下载链接:http://tecdat.cn/?p=23848 在本文中,决策树是对例子进行分类的一种简单表示.它是一种有监督的机器学习技术,数据根据某个参数被连续分割.决策树分析可以帮助解决分类和 ...

最新文章

  1. druid拦截器_CMS基于SpringBoot+Shiro+Mybatis+Druid+layui后台管理系统
  2. java连接Orcale数据库并查询、插入、删除数据
  3. 浏览器时间久了重新登录_以登录为例讲解什么是全面的测试设计
  4. php实现页面雪花效果,JavaScript_使用javascript实现雪花飘落的效果,看了javascript网页特效实例大全 - phpStudy...
  5. 深大转专业计算机,这所高校2020年1042人申请转专业!申请转出人数最多的竟是医学部...
  6. java 实现 web 客户端_Java web客户端和服务器端交互的原理
  7. Spring--总体架构
  8. 视音频编解码学习工程:JPEG分析器
  9. 第三次学JAVA再学不好就吃翔(part33)--final关键字
  10. AFN框架和SDWebImage框架的上手体验
  11. oracle运行产生的日志在哪里,运行临时表,是否有日志产生
  12. cocos2d-x 调用java_cocos2d-x中通过Jni实现Java与C++的互相调用
  13. 处于停机等非正常状态_汽轮机运行最重要的启动与停机阶段,你得了解这些实际经验...
  14. 埃航坠机事件调查结果公布时间!
  15. 男孩只知道疯跑,就像印第安人围着野牛一样
  16. 述职报告(2017-2018年度)
  17. 杰理之获取恒流充电的挡位值【篇】
  18. Old-school 老派 2016-10-01
  19. 学习笔记(117):R语言入门基础-前10名的行业和地区展示
  20. 一级计算机B理论知识和答案,计算机一级B试题+理论答案 10秋06

热门文章

  1. LeetCode【5--最长的回文子串】 LeetCode【6--Z字形变换】
  2. c++中的继承--1(引出,继承方式,继承的对象模型)
  3. 网络基础4(TCP三次握手,四次握手,TCP流量控制,TCP状态转换 , TCP异常断开,设置TCP属性,端口复用)
  4. 判断一段文件是UTF-8编码还是GB2312的编码方式
  5. make Image uImage与zImage的区别
  6. 线程创建-结束-回收 教程
  7. 远程桌面最新漏洞CVE-2019-0708 POC利用复现
  8. SVN中Revert changes from this revision 跟Revert to this revision
  9. 【CSS 技能提升】 :before和:after的使用
  10. Unity3D 装备系统学习Inventory Pro 2.1.2 基础篇