Pandas是用于数据处理的核心库,它也可以进行简单的可视化,绘制散点、折线、直方等基础图表都不在话下。

Pandas自带的可视化方法是基于matplotlib的函数接口,在Jupyter里可以静态展示。

这次介绍一个可视化工具-LUX,它能自动地将DataFrame数据转化为统计图表,让你可以一目了然地看到相关性、分布、频率等信息。

LUX在Jupyter Notebook或Lab中进行交互,图表与数据可以同步显示。

-

项目地址:

https://github.com/lux-org/lux

使用LUX

以下面数据集(美国各大学信息表)为例:

# 导入pandas和lux库
import pandas as pd
import lux#加载数据
df = pd.read_excel("C:\\Users\\zii\\Documents\\USA_College.xlsx")
df

读取的数据如下:

除了显示的数据表外,同时你还会看到数据集上面出现一个按钮,可以进行数据/图表的交换显示。

所以说只需要导入lux库,就能直接使用图表功能。

LUX显示有三种类型的图表,代表的统计学含义分别是相关性、直方分布、事件频次。

除了全表的可视化探索外,你还可以研究特定变量间的关系。

比如,我想看SAT平均值收入中位数的关联性.

df.intent = ['SAT平均值','收入中位数']
df

左边的表是两个变量的总体分布,右边是在有筛选条件下的分布。

导出图表

LUX支持图表的导出,既可以导出图表文件,也可以导出相应的matplotlib、altair代码。

首先选定一个或多个图表,点击导出按钮。

可以直接将选定的图表单独显示出来:

  1. 导出htmldf.save_as_html('hpi.html')

  2. 导出matplotlib代码

vis = df.exported
print (vis[0].to_matplotlib())

  1. 导出altair代码

vis = df.exported
print(vis[0].to_Altair())

导出的代码可以直接运行:

import altair as altchart = alt.Chart(df).mark_circle().encode(x=alt.X('SAT平均值',scale=alt.Scale(domain=(666, 1534)),type='quantitative', axis=alt.Axis(title='SAT平均值')),y=alt.Y('收入中位数',scale=alt.Scale(domain=(20200, 125600)),type='quantitative', axis=alt.Axis(title='收入中位数'))
)
chart = chart.configure_mark(tooltip=alt.TooltipContent('encoding')) # Setting tooltip as non-null
chart = chart.interactive() # Enable Zooming and Panning
chart = chart.encode(color=alt.Color('最高学位',type='nominal'))chart = chart.configure_title(fontWeight=500,fontSize=13,font='Helvetica Neue')
chart = chart.configure_axis(titleFontWeight=500,titleFontSize=11,titleFont='Helvetica Neue',
labelFontWeight=400,labelFontSize=8,labelFont='Helvetica Neue',labelColor='#505050')
chart = chart.configure_legend(titleFontWeight=500,titleFontSize=10,titleFont='Helvetica Neue',
labelFontWeight=400,labelFontSize=8,labelFont='Helvetica Neue')
chart = chart.properties(width=160,height=150)chart

安装设置

lux安装过程和其他库一样,可以通过pip或conda安装,直接在命令行输入:

pip install lux-api

conda install -c conda-forge lux-api

因为lux一般用在Jupyter生态中,所以需要安装并激活luxwidget拓展,才能显示交互式窗口。

如果你是在Jupyter Notebook或VSCode中使用,使用下面代码激活拓展:

jupyter nbextension install --py luxwidget
jupyter nbextension enable --py luxwidget

如果你使用的是Jupyter Lab,则激活lab拓展:

jupyter labextension install @jupyter-widgets/jupyterlab-manager
jupyter labextension install luxwidget

总结

LUX是一个不错的数据可视化分析工具,能智能地辅助Pandas做数据探索,省去了很多不必要的操作。

Python应用实战-LUX在pandas中智能可视化分析相关推荐

  1. 《Python数据分析实战》day2: Pandas中取得某行或者是某列的一点思考

    今天看了<Python数据分析实战>这本书的第四章:Pandas的简介的部分,大概看了一半,在实践代码的时候发现了jupyter notebook提示warning,研究了一下有了一些自己 ...

  2. Python数据分析实战,,美国总统大选数据可视化分析[基于pandas]

    目录 前言 一.任务详情 二.数据集来源 三.实现过程 四.运行代码 前言 在学习Python数据分析的过程中,是离不开实战的. 今天跟大家带来数据分析可视化经典项目,美国总统大选数据可视化分析,希望 ...

  3. R语言dplyr包使用recode函数进行数据列内容编码、转换实战:类似于pandas中的map函数(例如,将内容从字符串映射到数值)

    R语言dplyr包使用recode函数进行数据列内容编码.转换实战:类似于pandas中的map函数(例如,将内容从字符串映射到数值) 目录

  4. 知乎爬虫与数据分析(二)pandas+pyecharts数据可视化分析篇(上)

    注:代码完整版可移步Github--https://github.com/florakl/zhihu_spider. 知乎爬虫与数据分析(一)数据爬取篇 知乎爬虫与数据分析(三)pandas+pyec ...

  5. pandas 把某一列中字符串变数值_Python学习教程:Python数据分析实战基础 | 初识Pandas...

    这段时间和一些做数据分析的同学闲聊,我发现数据分析技能入门阶段存在一个普遍性的问题,很多凭着兴趣入坑的同学,都能够很快熟悉Python基础语法,好像自己什么都会了一点,然而实际操作起来既不知从何操起, ...

  6. 万字长文,Python数据分析实战,使用Pandas进行数据分析

    文章目录 很多人学习python,不知道从何学起. 很多人学习python,掌握了基本语法过后,不知道在哪里寻找案例上手. 很多已经做案例的人,却不知道如何去学习更加高深的知识. 那么针对这三类人,我 ...

  7. Python数据分析实战基础 | 初识Pandas

    这是Python数据分析实战基础的第一篇内容,主要是和Pandas来个简单的邂逅.已经熟练掌握Pandas的同学,可以加快手速滑动浏览或者直接略过本文. 01  重要的前言 这段时间和一些做数据分析的 ...

  8. python查看dataframe数据类型_python pandas中DataFrame类型数据操作函数的方法

    python数据分析工具pandas中DataFrame和Series作为主要的数据结构. 本文主要是介绍如何对DataFrame数据进行操作并结合一个实例测试操作函数. 1)查看DataFrame数 ...

  9. python apply lambda if_在Pandas中使用Apply Lambda函数和多个if语句

    我试着根据像这样的数据框中一个人的大小推断出一个分类:Size 1 80000 2 8000000 3 8000000000 ... 我希望它看起来像这样:Size Classification 1 ...

最新文章

  1. 【2018-01-22】HTML-表单及表单元素
  2. 数据中台-阿里巴巴的数据整合、价值发掘、社会赋能之道
  3. Android开发返回拍摄的图片
  4. 居中符号怎么打_小学语文标点符号的正确书写格式(附图文展示),让孩子牢记考试不丢分!...
  5. 操作系统设计与实现第3版笔记与minix3心得(3)-操作系统发展历史(1)
  6. 再谈RDD、DataFrame、DataSet关系以及相互转换(JAVA API)
  7. 数学知识巧学JCF(Java Collections framework)
  8. 查询空值中的注意事项
  9. 狂雨CMS小说网站源码 附一套pc模板和两套手机模板(白色,蓝色)
  10. 最经典的职场十大理论,好文值得一看滴童鞋们。2
  11. android中shape的属性
  12. 从三流本科到北京985高校研究生,这是我走过的四年
  13. 【转】常见面试题思想方法整理--- 原来果然有双指针遍历
  14. mysql强制安装参数_Mysql编译安装参数优化
  15. 华为云redis安装
  16. 阿里云 OSS 客户端直传 Policy 模式使用
  17. mysql compute_compute by 的使用
  18. 淘宝app搜索排名优化技巧
  19. 2021年春季 PAT乙级(复盘)
  20. 微信小程序商城项目实战(第四篇:商品详情页)

热门文章

  1. SDH光端机概述与技术应用详解
  2. 开关量光端机产品特点及应用范围介绍
  3. 家用光纤猫设备、光纤收发器和光电交换机介绍
  4. [渝粤教育] 中国地质大学 大学英语(6) 复习题
  5. kafka metric java,jmx_exporter+prometheus+grafana实现kafka metric监控
  6. labview求n阶乘的和_求极限方法总结
  7. 发言稿开场白范文_发言稿开场白
  8. 全面认识Small Cell
  9. java初始化该字符串值_java字符串数组初始化和赋值
  10. 从客户的角度看网站涉及的第一要素