萧箫 发自 凹非寺
量子位 报道 | 公众号 QbitAI

加载一个Jupyter插件后,无需写代码就能做数据分析,还帮你生成相应代码

没错,只需要加载这个名为Mito的小工具包,用Python做数据分析,变得和用Excel一样简单:

运行速度比Excel更快,也不需要到处搜各种Python教程了。

好用如Excel,更快更全面

Mito是Jupyter notebook的一个可编辑电子表格插件,在编辑.csv表格(带格式转换功能)时,就能生成相关Python代码。

Mito,线粒体Mitochondria的缩写

具体来说,Mito的出现,像是将Python的强大功能、和Excel的易用性进行了结合。

只需要掌握Excel的用法,就能使用Python的数据分析功能,还能将写出来的代码“打包带走”。

它弥补了Excel在数据分析上的几个缺陷

  • Excel无法做大数据分析(大型数据集处理得不好)

  • Excel运行缓慢

  • Excel无法轻松创建可重复流程

同时,又比SQL和Python更简单、直观。毕竟这些专业工具对于0基础初学者来说,需要至少几年时间,才能完全上手。

据Mito内测用户表示,这款插件让他们用Python做数据分析的效率提升了10倍,因为用户可以直接在Mito里编写Excel公式,如=SUM(A1, 100)。

那么,Mito是怎么做到将Excel逻辑转换成Python代码的呢?

作者们编写了一种名为Transpiler的程序,有点类似于编译器的功能,采用抽象语法树(AST),解析Excel源代码,并转换成Python的源代码。

相比于采用专业软件如Alteryx(需要5000美元/月)进行数据分析,Mito所生成的Python代码可以根据需要自行修改,灵活性更高一点。

目前,Mito采用亚马逊云平台 (AWS)保存用户的相关数据,每个用户拥有一个独立账户。

当然,用户也可以选择将数据保存在本地。

自动生成Python代码

以分析美国各州的“家庭平均收入”和“允许托运的火车站数量”这两个数据的关系为例。

首先,上传“家庭平均收入”和“允许托运的火车站数量”两份数据。

数据处理的格式是.csv,当然也可以输入Excel文件,并用Mito转成两份.csv文件。

然后,将这两份数据集合并在一起,只需要用鼠标勾选对应功能、选中相关数据列就行。

啪!代码就生成好了。

然后,是做数据透视表,在完成分组后,采用聚合(aggregate)功能来切换聚合方法。

还包括数据过滤功能,同样立刻就能生成相关代码。

包含升降序排序功能,快速简洁。

然后就是相关数据统计、分析出结果了,流程直观。

保存分析文件的方法也很简单,文件是以Python编写的,而不是用比较难懂的VBA。

要想重复上面的步骤的话,也非常容易,Mito自带“重复已保存分析步骤”功能,一键就能用同样的方法分析其他数据。

确实要比一行行编写代码简单多了。

关于Mito

那么,Mito的作者们,为什么要搞这个软件?

因为他们发现,所谓的“几天上手Python数据分析”,其实根本没有那么容易……

初学者要想用Python搞数据分析,就得不停地查看各种文档、和求助于StackOverflow。

要想真正快速用Python分析数据,最后还得自己编写软件。

三位作者Aaron Diamond-Reivich、Jake Diamond-Reivich和Nate Rush都来自宾大,在学校期间,他们学习了计算机科学、统计学和商业分析相关的课程。

也正是在搞数据分析的时候,他们萌生了想要制作Mito的想法。

作者表示,软件目前还没有开源,因为他们还在思考,如何支持维护这个项目,并转到开源路径上来。

不过,它现在已经可以使用了。

感兴趣的小伙伴们,可以上手试试了~

项目主页:
https://trymito.io/launch

—  —

本文系网易新闻•网易号特色内容激励计划签约账号【量子位】原创内容,未经账号授权,禁止随意转载。

点这里????关注我,记得标星,么么哒~

加入AI社群,拓展你的AI行业人脉

量子位「AI社群」招募中!欢迎AI从业者、关注AI行业的小伙伴们扫码加入,与50000+名好友共同关注人工智能行业发展&技术进展

一键三连「分享」、「点赞」和「在看」

科技前沿进展日日相见~

0代码就能做Python数据分析,这个Jupyter插件,用起来就像Excel一样简单相关推荐

  1. 一木.溪桥---Python数据分析之Jupyter

    一木.溪桥---Python数据分析之Jupyter Jupyter安装 Jupyter使用 快捷键 Jupyter安装 安装命令:pip install jupyter Jupyter使用 Step ...

  2. python怎么筛选excel数据_懂Excel也能轻松入门Python数据分析包pandas(二):高级筛选(上)-excel筛选...

    转发本文并私信我"python",即可获得Python资料以及各种心得(持续更新的) 系列文章: 前言 经常听别人说 Python 在数据领域有多厉害,结果学了很长时间,连数据处理 ...

  3. php 教师批改作业代码,html5 canvas做批改作业的小插件代码示例

    本篇文章小编给大家分享一下html5 canvas做批改作业的小插件代码示例,代码介绍的很详细,小编觉得挺不错的,现在分享给大家供大家参考,有需要的小伙伴们可以来看看. 需求分析 能进行批改,就是相当 ...

  4. 系统架构设计师与系统分析师历年实体分析与解答下载_做Python数据分析5年了,复制粘贴是我最牛逼的技能,直到看到这些公众号,我学习了...

    上次跟一个学妹聊天,问她平时怎么学习,她反手甩给我这几个公众号,说很喜欢里面的技术文章,推荐给大家 深度学习这件小事 机器学习,深度学习,自然语言处理,计算机视觉--这些小事情,只要你主动,我们就有可 ...

  5. python数据分析报告的格式_Python数据报表之Excel操作模块用法分析

    本文实例讲述了Python数据报表之Excel操作模块用法.分享给大家供大家参考,具体如下: 一 点睛 Excel是当今最流行的电子表格处理软件,支持丰富的计算函数及图表,在系统运营方面广泛用于运营数 ...

  6. python 数据分析 |2. Jupyter Notebook配置和使用

    Jupyter Notebook功能强大,数据科学家可以在其中进行数据可视化,也可以创建和共享他们的文档,能帮助数据简化工作流程,实现更高的生产力和更便捷的协作. 目录 1. Jupyter Note ...

  7. python to_excel新增sheet_Python使用xlrd和xlwt读写Excel的简单用法

    前言 数据处理是 Python 的一大应用场景,而 Excel 则是最流行的数据处理软件.因此用Python 进行数据相关的工作时,难免要和 Excel 打交道. 标准的 Excel 文件(xls/x ...

  8. Python和Excel终于互通了!这个Jupyter插件能自动生成代码并实现数据分析

    加载一个Jupyter插件后,无需写代码就能做数据分析,还帮你生成相应代码? 没错,只需要加载这个名为Mito的小工具包,用Python做数据分析,变得和用Excel一样简单: 以 Excel 为代表 ...

  9. 1行代码实现Python数据分析:图表美观清晰,自带对比功能丨开源

    公众号关注 "视学算法" 设为 "星标",DLCV消息即可送达! 萧箫 发自 凹非寺 转自 | 量子位 你是否也在朋友圈看过这样的小广告: 「你要悄悄学Pyth ...

最新文章

  1. python和c++的相互调用教程
  2. 南农Nature Microbiology一作顾少华:我与铁载体的这5年
  3. 代理 设置wsl_第一次使用WSL我做了什么
  4. pymysql Key error:255的解决办法
  5. eclipse运行时出现Unable to execute dex
  6. Boost.Flyweight 复合设计示例
  7. 部署在SAP ABAP服务器上的SAP UI5应用,resource root的计算逻辑
  8. 抽象编程语言(APL)是什么?
  9. java由谁创建_透析Java本质-谁创建了对象,this是什么
  10. 【重识 HTML + CSS】CSS 选择器
  11. 如何写好科研论文思维导图分享
  12. 汽车电子学习笔记---CAN网络(二)
  13. Arduino Adafruit GFX图形库介绍(三)- 图形基本元素
  14. am解调matlab程序,AM调制解调的matlab仿真
  15. linux-快速返回上次所在目录
  16. C++之文件批量改名
  17. 安防摄像头RTSP/Onvif协议网页无插件直播视频流媒体服务器EasyNVR之按需直播如何有效利用最大上行带宽
  18. python学习(二)
  19. 物流公司的发出时间在哪里查询,快递单号查询方法
  20. 线性代数(1)- 向量空间

热门文章

  1. 如何获取字符串的最后一个字符?
  2. 我爸和在我们小区里的一位老大爷
  3. PHP 7.0新增特性详解
  4. C语言中使用MySQL(Linux下)
  5. [Bjoi2014]大融合
  6. 线程同步 – lock和Monitor
  7. 《Python 学习手册4th》 第四章 介绍Python对象类型
  8. Sealed,new,virtual,abstract与override的区别
  9. 子主题function php,wordpress子主题怎么添加
  10. 关于python字典以下选项中描述错误的是_关于 Python 对文件的处理,以下选项中描述错误的是_学小易找答案...