大家好,我是东哥。

不得不说,Jupyter对于表的处理真的是越来越方便了,很多库可以直接实现可视化操作,无需写代码。但是这还不够,最近看到一个神器叫Mito,它真的是做到了无需写一行代码,而且手动的操作可以自动转换为代码,供后续批量化操作,这简直不要太爽。

一、Mito是什么?

MitoJupyter notebook的一个插件,作用是编辑电子表格,并在编辑表格(带格式转换功能)时,可以生成相对应的Python代码。

下面是具体的操作演示,感受一下它的强大!

使用Mito和使用Excel表格没什么太大区别,只需要掌握一些Mito的自定义函数即可,然后它会自动生成pandas处理表的代码。

二、Mito 安装

Mito的安装要求比较简单,有两个:

  • Python 3.6或更高版本

  • 需要安装了Node

打开终端,直接pip安装:

pip install mitosheet

然后,安装JupyterLab扩展管理器。这个命令可能需要运行个几分钟:

jupyter labextension install @jupyter-widgets/jupyterlab-manager@2

最后,启动JupyterLab就完事了。

jupyter lab

也可以用conda安装到一个虚拟环境里。

三、Mito 操作方法

创建一个表

import mitosheet
mitosheet.sheet()

导入数据

可以使用pandas读入数据生成dataframemitosheet。如果不想写代码,也可以手动点导入按钮导入数据,导入数据代码会自动生成。

# import Python packages
import mitosheet
import pandas as pd# Create a simple dataframe to display
car_data = pd.DataFrame({'car': ['Toyota', 'Nissan', 'Honda', 'Mini Cooper', 'Saturn'], 'mph': [60, 50, 60, 75, 90], 'length': [10, 12, 13, 8, 9]})# render the Mitosheet with car_data
mitosheet.sheet(car_data)

操作方法

Excel一样,一般的两种方法。

1.公式法: 如果对公式熟练,直接敲入函数即可,比如sumsumif这种等等。公式法其实就是个孰能生巧的事。我看了下,Mito中的函数不复杂,使用很容易上手。

2.分析工具: 如果不熟练函数,Mito也提供了分析工具,比如合并、透视表、筛选、排序、保存分析等部分功能,都是点点点的操作。

对于分析工具,给大家演示几种常见的数据处理操作,找找感觉。

合并数据集

Mito的合并功能可用于将数据集水平组合在一起。通过查找两个表关键列的匹配项,然后将这些匹配项数据组合到一行中。

首先,选择要合并在一起的两个Mito工作表。其次,选择合并的键。最后,选择保留哪些列。

数据透视表

首先,选择一个关键字对数据分组。然后,如果想进一步将组分层为单个单元格,继续选择列。最后,选择聚合的列和方法。

筛选

Mito通过组合过滤器和过滤器组来提供强大的过滤功能。

  • 过滤器是单个条件,对于该列中的每个单元格,其评估结果为true或false。

  • 过滤器组是结合了布尔运算符的过滤器聚合。

排序

保存分析

可以像保存宏一样保存分析。通过保存分析,可以保存应用于数据的转换,以便以后可以将其重新应用于新的数据集。

四、后话

对于Mito的背后原理,这里不过多介绍,如果感兴趣可以参考这篇博客:

https://trymito.io/blog/transpiler

Mito的创作者是三位来自宾大的学霸 Aaron Diamond-Reivich、Jake Diamond-Reivich和Nate Rush,他们是在搞数据分析的时候,萌生了想要制作Mito的想法。

据了解,目前这个软件还没有开源,他们还在思考如何支持维护这个项目,并转到开源路径上来。

参考:https://docs.trymito.io/



往期精彩回顾适合初学者入门人工智能的路线及资料下载机器学习及深度学习笔记等资料打印机器学习在线手册深度学习笔记专辑《统计学习方法》的代码复现专辑
AI基础下载机器学习的数学基础专辑
本站qq群851320808,加入微信群请扫码:

【Python】又一个Jupyter神器,操作Excel自动生成Python代码!相关推荐

  1. 又一个Jupyter神器,操作Excel自动生成Python代码

    来源 | Python数据科学(ID: PyDataScience) 不得不说,Jupyter对于表的处理真的是越来越方便了,很多库可以直接实现可视化操作,无需写代码.但是这还不够,最近看到一个神器叫 ...

  2. 又一个 Jupyter 神器,操作 Excel 自动生成 Python 代码

    大家好,Jupyter对于表的处理真的是越来越方便了,很多库可以直接实现可视化操作,无需写代码. 但是这还不够,最近看到一个神器叫Mito,它真的是做到了无需写一行代码,而且手动的操作可以自动转换为代 ...

  3. java插件开发_编写一个IDEA插件之:自动生成Java代码

    我很喜欢IDEA的一键自动生成代码功能,例如自动生成构造方法.字段的Get/Set方法.ToString方法等等,除此之外,也有一些插件提供自动生成代码的功能,例如我们所熟悉的GsonFormat插件 ...

  4. 【Python】利用graphviz和pycallgraph库自动生成Python函数调用关系图

    一.下载并安装graphviz 因为这个模块依赖Graphviz2.38这个软件,这个贝尔实验室大牛为画图提供的一个命令行工具. 下载地址:https://graphviz.gitlab.io/_pa ...

  5. python读取一个TXT转换成EXCEL表格

    [任务]:python读取一个TXT转换成EXCEL表格 [坑1]pycharm安装后代码区不能编辑,是由于最新的pycharm在安装时自动装了vimVim插件, 方法一:在tools-Vim emu ...

  6. python写一个表白程序-用Python写一个表白神器让你脱单

    原标题:用Python写一个表白神器让你脱单 来自公众号:Python编程时光 今天是什么节日,就不用小明说了吧? 有女朋友的,该准备的礼物买了吗? 没有对象的,表白的套路学会了吗? 还没有?好吧,你 ...

  7. python处理excel表格实例-使用Python操作excel文件的实例代码

    使用的类库 pip install openpyxl 操作实现 •工作簿操作 # coding: utf-8 from openpyxl import Workbook # 创建一个excel工作簿 ...

  8. python表白神器_用Python写一个表白神器让你脱单

    原标题:用Python写一个表白神器让你脱单 来自公众号:Python编程时光 今天是什么节日,就不用小明说了吧? 有女朋友的,该准备的礼物买了吗? 没有对象的,表白的套路学会了吗? 还没有?好吧,你 ...

  9. Sphinx——自动生成Python文档

    Sphinx是一个可自动生成python项目api的工具,使用起来也比较简单,只需要在项目上进行简单的配置,即可生成项目的api文档 简介 Sphinx是Python文档生成器,它基于reStruct ...

最新文章

  1. 爷青回!GAN生成的超级马里奥关卡,可以永不通关的那种!
  2. linux dmesg 格式化时间
  3. 编程艺术 二进制中1的个数
  4. 【nodejs笔记3】Express基本用法,和路由控制,和模板渲染ejs
  5. Pixhawk代码分析-源码框架
  6. cargo maven_用于集成测试的Maven Cargo插件
  7. SAP License:SAP S/4HANA就是答案
  8. java事物 tran_Java基础——事务
  9. gps坐标转成火星坐标
  10. python word 表格复制_python实现同一word中的表格分别提取并保存到不同文件下
  11. AtCoder Grand Contest 007题解
  12. python怎么注释作者_python作者注释
  13. HALCON算子函数总结(中)
  14. [vue build Error] 在vue的图形化界面对项目进行打包时出现“Callback was already called”错误
  15. MarkdownPad 2使用教程(语法篇)
  16. 浏览器兼容性测试工具Browser Sandbox
  17. ENSP中PC机如何从DHCP服务器上自动获取固定的IP地址
  18. 开关电源学习——基本元件之电容
  19. python使用selenium模块实现火车票的自动购买
  20. 华为nova7和nova7pro有什么区别(华为nova7系列配置参数及常见问题)

热门文章

  1. python subprocess Popen
  2. 多个视频切换时,只改变SourceFilter,不改变Filter Graph中其他Filter的C#实现
  3. mvc基础系列说谈(5)——参数与值传递,提交数据
  4. MySQL数据库“十宗罪”(十大经典错误案例)
  5. windows自动修复失败,无法启动
  6. bzoj1854 [Scoi2010]游戏——匈牙利算法
  7. 160407、java实现多线程同步
  8. 项目管理13禁忌[转]
  9. 正则 至少是数字加英文字符_正则表达式-入门
  10. 中医药可投期刊推荐-24本-2021版