GitHub上一位博主告诉你:不用学,用sweetviz就行。

这是一个基于Python编写的数据分析软件,只要掌握3种函数用法,一行Python代码就能实现数据集可视化、分析与比较

我们以Titanic数据集为例,输入一行代码:

一个1080p的清晰网页界面就出现在了眼前。

不仅根据性别、年龄等不同栏目纵向分析数据,每个栏目下还有众数、最大值、最小值等横向对比。

所有输入的数值、文本信息都会被自动检测,并进行数据分析、可视化和对比,最后帮你进行数据总结。

在这样的数据分析下,结果一目了然。

Titanic数据集部分功能细节展示

这样的效果,是基于3个主函数实现的。

3种函数用法

analyze()丨数据分析

数据分析函数中,有4个参数source,target_feat,feat_cfg和pairwise_analysis需要被设置。

source:以pandas中的DataFrame数据结构、或是DataFrame中的某一类字符串作为分析对象。

target_feat:需要被标记为目标对象的字符串。

feat_cfg:需要被跳过、或是需要被强制转换为某种数据类型的特征。

pairwise_analysis:相关性和其他类型的数据关联可能需要花费较长时间。如果超过了某个阈值,就需要设置这个参数为on或者off,以判断是否需要分析数据相关性。

数据相关性分析效果,可能需要花费一定时间

compare()丨两个数据集比较

如果想要对两个数据集进行对比分析,就使用这个比较函数。

例子中的my_dataframe和test_df是两个数据集,分别被命名为训练数据和测试数据。

除了这个被插入的数据集,剩余的参数与analyze中的一致。

compare_intra()丨数据集栏目比较

想要对数据集中某个栏目下的参数进行分析,就采用这个函数进行。

例如,如果需要比较“性别”栏目下的“男性”和“女性”,就可以采用这个函数。

理解这几种函数的变量后,一行代码就能实现Python数据分析。

使用指南

sweetviz支持Python 3.6+和Pandas0.25.3+环境,配置好环境后,使用万能的pip下载安装包:

但有一个条件需要注意:sweetviz需要用到基础「os」模块。所以,如果你在使用类似于Google Colab的自定义环境,可能会无法使用sweetviz,目前开发者也在探索解决方案。

下载好后,使用import快速导入sweetviz,就可以开始使用了~

sweetviz使用的原理是,使用一行代码,生成一个数据报告的对象(其中,my_dataframe是pandas中的DataFrame,一种表格型数据结构):

在这里,analyze函数可以被替换为compare或compare_intra函数,使用方法在上面已经给出,全看你需要什么类型的数据报告了。

最后,用show一键输出。(结果会以SWEETVIZ_REPORT.html网页形式展示)

由于在这个过程中,实际上真正需要编写的只有第二行的生成对象代码,可以说是名副其实的1行代码生成数据分析。

展示界面也非常简洁,只要鼠标停留在感兴趣的栏目上,右侧就会自动显示出数据分析的图表和报告。

感兴趣的小伙伴,快戳下方的传送门用起来吧~

传送门:

https://github.com/fbdesignpro/sweetviz

行代码实现数据集可视化、分析与比较相关推荐

  1. python用excel数据做热力图_7行代码 Python热力图可视化分析缺失数据处理-Python 实用宝典...

    Python热力图寻找缺失数据 你有没有遇到一种情况,处理一张很大的csv表格的时候很难找到表格中每一列的缺失数据,或者说处理速度非常慢 ?当然如果你的Excel水平非常高,这个可能不会成为你的问题, ...

  2. 初次玩pyecharts:30行代码做一个可视化广东省各地天气温度排行图

    初次玩pyecharts:30行代码做一个可视化广东省各地天气温度排行图 开篇点题,直接上效果图 开篇再点题,直接上源码 import re import requests from pyechart ...

  3. 3行代码就能可视化Transformer的奥义 | 开源

    点击上方"视学算法",选择加"星标"或"置顶" 重磅干货,第一时间送达 博雯 发自 凹非寺 量子位 报道 | 公众号 QbitAI Tran ...

  4. 员工每月工资数据集可视化分析

    前言 最近在学习<从零开始学Python数据分析>这本书,第六章的综合实例--巴尔的摩公务员工资数据集,原网站上数据集被清除,于是在Kaggle上寻找了相似的数据"Employe ...

  5. 基于澳大利亚气象数据集可视化分析及降雨预测

      1:探索性分析代码流程    2:数字特征处理    3:非数字类型的特征处理    4:特征拼接    5:标签处理    6:数据集划分    7:模型评价    8:数据可视化 仅供大家参考 ...

  6. 鸢尾花数据集可视化分析

    在搜索鸢尾花数据集时看到一篇基于鸢尾花数据集的文章,其中数据可视化部分做的很好,所以自己在此复现一下,原文链接如下:https://www.jianshu.com/p/52b86c774b0b 一:导 ...

  7. 2009-2019年亚马逊畅销书50强数据集可视化分析-基于Pandas-Seaborn

    Amazon Top 50 Bestselling Books 2009 - 2019 导入相关的包 import numpy as np import pandas as pd pd.plottin ...

  8. 奥运会数据集可视化分析

    加载120年来的奥运会的csv数据,将参赛国家.参赛项目.参赛选手等情况做一份数据可视化. 1.总体情况仪表板. 总体情况仪表板由3张工作表组成,分别是各界运动员数量折线图,各界参赛国家数,各界赛事项 ...

  9. python数据挖掘学习笔记】十九.鸢尾花数据集可视化、线性回归、决策树花样分析

    #2018-04-05 16:57:26 April Thursday the 14 week, the 095 day SZ SSMR python数据挖掘学习笔记]十九.鸢尾花数据集可视化.线性回 ...

最新文章

  1. Linux下的Memcache安装(含libevent的安装)
  2. android 视频转字节,如何将视频文件(.mp4)格式转换为android中的二进制格式?...
  3. AD学习笔记2021-5-29
  4. [Alpha]Scrum Meeting#5
  5. 微课|玩转Python轻松过二级:第3章课后习题解答2
  6. 常常被人忽略的VC备份
  7. 基于RGB图像的草莓叶片白粉病检测深度学习方法
  8. java 原子long_java中long和double类型操作的非原子性探究
  9. linux命令psd,Linux 下查看 Photoshop PSD 文件
  10. deepinv2 添加打印机_科学网-Deepin Linux虚拟PDF打印机的安装与妙用-黄健的博文
  11. 华为服务器维修期,拆看一台1U华为服务器RH1288 V2-8S
  12. 微信自动推送早安问候教程
  13. mybatis pagehelper自定义count语句
  14. 5 开源Math.NET基础数学类库使用 C#解析Delimited Formats数据格式
  15. Excel技能之计数求和,让你成为高手之路的机车手
  16. vue elementUI实现消息通知功能
  17. Android-使用SoundPool实现语音计算器
  18. JSON 字符串是如何被解析的?JsonParser 了解一下
  19. STM32F030 RTC内部晶振/外部晶振/闹钟
  20. 美观实用!吹爆这个中文排版开源项目

热门文章

  1. 字典创建列表的2种方法,作业
  2. RabbitMQ核心概念
  3. 【log】12/11 checking project:(Laravel)snsTest
  4. 用Kettle的一套流程完成对整个数据库迁移 费元星
  5. 降Mail十八章(上)
  6. 在WinForm中使用Web Services 来实现软件自动升级(转)
  7. 鸿蒙铝模脱模剂,铝模采用这项技术,前3层不需再涂油性脱模剂,将成铝模出厂标配...
  8. 识别图片并可视化_识别交通锥,特斯拉驾驶信任提升的一小步
  9. php循环获取xml节点,PHP_PHP遍历XML文档所有节点的方法,本文实例讲述了PHP遍历XML文档 - phpStudy...
  10. 微软拼音输入法2007状态栏无法显示!