我们很多人学习python是为了开发,但是也有的人的是为了数据分析,今天小猿圈就给大家分享一些数据分析的工具,希望能帮助到大家,让大家的数据分析更便捷。 处理较大、较复杂的类excel数据 • Pandas -处理tabular(类似Excel)数据的通用工具套件 • SQLite – Tabular数据库格式,能够处理大规模数据集,同时也能在桌面环境运行。 • PostgreSQL – 企业级数据库系统 处理空间、地理数据: PostGIS – Postgres的地理空间数据类型扩展 Carto – 地理空间数据的商业数据挖掘工具 Mapbox – 商业地图绘制工具,同时也是一个web地图系统。 Leaflet – 基于网络资源和本地数据开发活动web地图的代码库 qGIS – 适用于几乎所有地理空间和地图绘制的图形化GIS工具 处理非常规数据: • RethinkDB – 处理实时数据流非常棒的数据库,正在从商业转开源,小心使用。 • MongoDB – 处理大规模非结构化和半结构化数据的流行数据库,应用于生产环境需要加小心。 • CouchDB – 与MongoDB有些类似但不尽相同。 • Cassandra – 图谱和关系数据库 为大规模数据集创建性能代码: • Pandas – Python下一个开源数据分析的库,它提供的数据结构DataFrame极大的简化了数据分析过程中一些繁琐操作。 • Apache Spark – 一个通用的高性能数据处理系统 • SciPy and Numpy -可编写脚本的基于C的数值算法,能在紧凑的,底层机器数据架构上运行。 • Cython – 使用用C编译器的Python编译器,用来提升Python性能。 • PyOpenCL – 在图形显卡上进行数值计算和统计处理。 数据清洗工具 • ODO – 在不同数据格式间进行转换的Python库。 • OpenRefine – 拥有图形用户界面的数据发现和清洗工具 • Pandas – 数据科学任务中用来处理tabular数据的通用Python工具集 • Scrapy – Python开发的一个快速,高层次的屏幕抓取和web抓取框架,用于抓取web站点并从页面中提取结构化的数据。 • BeautifulSoup – 与Scrapy类似但不尽相同 • Scrubadub – 去除个人身份信息 • Arrow – 帮你轻松驾驭日期和时间戳的Python库 • DataCleaner – 剔除脏数据的Python库 • Dora – 与DataCleaner功能类似的Python库。 数据可视化工具 • Processing – 交互式开发交互式可视化内容. 推荐读本:Visualizing Data • D3 – 在web上开发可视化交互 • C3 – 来自D3的图表. • Bokeh – 与D3类似, 但基于Python. • matplotlib – 最早的Python数据可视化工具集。 • Leaflet – 一个为开发移动设备友好的互动地图的开源 JavaScript 库。 • MapBox -详见地图工具集。 • qGIS – 详见地图工具集。 • VTK – 在医疗、 和物理研究领域常用的重型可视化工具包。 数据挖掘和机器学习工具 • Weka – 一个机器学习和数据挖掘工具包,这里有一本免费可读的参考书 • SciKitLearn – 基于Python的机器学习和数据挖掘工具套件。 • Orange – 另一个基于Python的数据挖掘工具套件,同样拥有图形用户界面。 • TensorFlow – Google开源的多维度图谱数学建模工具。 分享、协作以及知识管理工具 • Django -基于Python的web框架 • Django REST Framework – 为Django网站创建 REST APIs • IRODS – 企业级数据存储和管理,包括元数据管理和基于规则的数据处理。 • Cassandra (useful for metadata and relationship storage) – 一个存储和查询元数据经常用到的开源分布式数据管理系统 • GitLab -GitHub的开源替代品,可搭建私人服务器。 • ReciPy – • Prov – Python implementation of the W3C provenance model • Kanren (部署基于元数据和数据源信息的业务逻辑非常有用) – 一个描述性Python逻辑编程系统,非常适合科学元数据的查询和基于规则的处理。 • 好了今天的分享就是这么多,希望能够帮助到大家,这些工具涉及到了我们数据分析师的每个工作内容,希望可以让我们复杂的工作变得更加便捷更加灵活,觉得不错的话要推荐给身边的朋友哦,记得收藏加关注。

转载于:https://juejin.im/post/5cef3402e51d4510b71da594

小猿圈分享-数据分析工具相关推荐

  1. 小猿圈python视频_小猿圈分享学习Python的最佳方式

    原标题:小猿圈分享学习Python的最佳方式 python现在是世界上功能最多的编程语言之一,可以是用Python编辑应用程序,游戏.算法程序.还可以编程一个机器人,学习Python可以担任软件工程师 ...

  2. 小猿圈分享利用python网络爬虫获取网易云歌词

    今天小猿圈给大家分享网易云音乐歌词爬取方法. 本文的总体思路如下: 找到正确的URL,获取源码: 利用bs4解析源码,获取歌曲名和歌曲ID: 调用网易云歌曲API,获取歌词: 将歌词写入文件,并存入本 ...

  3. 小猿圈分享使用Java模拟三道门的游戏

    美国以前有一个综艺节目.参赛者会看见三扇关闭了的门,其中一扇的后面有一辆汽车,选中后面有车的那扇门可赢得该汽车,另外两扇门后面则各藏有一只山羊.当参赛者选定了一扇门,但未去开启它的时候,节目主持人开启 ...

  4. mysql 保留5位小数_小猿圈分享-MySQL保留几位小数的4种方法

    今天小猿圈给大家分享的是MySQL使用中4种保留小数的方法,希望可以帮助到大家,让大家的工作更加方便. 1 round(x,d) 用于数据x的四舍五入, round(x) ,其实就是round(x,0 ...

  5. bigdecimal除法保留4位小数_小猿圈分享-MySQL保留几位小数的4种方法

    今天小猿圈给大家分享的是MySQL使用中4种保留小数的方法,希望可以帮助到大家,让大家的工作更加方便. 1 round(x,d) 用于数据x的四舍五入, round(x) ,其实就是round(x,0 ...

  6. 前端 鼠标一次移动半个像素_小猿圈分享2019年前端JavaScript面试题(三)

    上篇文章小猿圈前端讲师为你分享了前端面试中js遇到的一些基础问题,接下来给大家讲解的就是前端基础和理论问题都有哪些,想学习web前端就来小猿圈自学吧,里面有全面的技术指导,还有专业的老师为你解答问题. ...

  7. 猿圈笔试系统java_小猿圈分享Java面试题

    马上又到毕业季了,很多同学都很迷茫,不知道该选择哪个方向,也有的同学害怕找不到工作,今天小猿圈就给大家分享一下关于初学者的Java面试题 1.面向对象的特征有哪些方面? 答:面向对象的特征主要有以下几 ...

  8. 小猿圈分享适合零基础学python的书籍

    近几年python这门语言可谓是出尽了风头,排名越来越靠前,用的人越来越多,所以市面上培训python的机构也数不胜数,当人了有些人不方便去参加培训班的同学,就选择了自学,今天小猿圈就给大家分享. 一 ...

  9. 小猿圈分享-web报表中电子印章/水印的轻松实现

    报表数据系统中,有一个重要功能叫做电子签章,通俗的讲,就是不需要实际去盖章,而直接把印章打印到纸质文件上,省去手工盖章的费时费力环节,例如,银行系统中的银行流水打印,都需要盖章才能生效,如果按传统的做 ...

  10. 设置框开始隐藏状态html5,小猿圈分享HTML5中form如何关闭自动完成功能的方法

    WEB前端现在是时下较火的编程语言之一,但是对于怎么学习或者学习哪些内容很多朋友都是不了解的,针对以上内容小猿圈web前端讲师总结了form如何关闭自动完成功能的方法?希望对你的前端学习有一定的帮助. ...

最新文章

  1. 作为一只Python爬虫:如何破解滑动验证码
  2. 八大操作系统掌门人齐聚 1024 程序员节,千年岳麓见证开源新时代
  3. [收藏] Java 编程的动态性
  4. linux脚本运行java程序设计_Java运行Shell脚本
  5. Openfire on Centos7
  6. Leetcode每日一题:110.balanced-binary-tree(平衡二叉树)
  7. gorilla websocket无法跨域_聊聊浏览器同源策略与跨域方案详解
  8. C#(数据结构):1.顺序表结构(3)
  9. 2)Java中的==和equals
  10. python decorator_python3(十八)decorator
  11. L. Leverage MDT
  12. vue导出Excel
  13. Appium_3_环境配置_Appium-desktop配置
  14. 银河麒麟安装node
  15. 别让学历限制你,你可能是AI领域的下一个巨星
  16. java swing paint_Java Paint未在Swing中绘制
  17. Keras区分狗和猫
  18. 杰理强制升级工具4.0使用和原理解析
  19. 【回溯】B042_LQ_滑动解锁(dfs + 跨点判断)
  20. 他们是我的父母 我能怎么办?

热门文章

  1. Python的单元测试工具——doctest
  2. 【转】onAttachedToWindow()在整个Activity生命周期的位置及使用
  3. Eclipse开发环境设置(Maven+Spring MVC+Flex)
  4. C++相对于C语言更加规范(1)
  5. 数据挖掘十大算法-决策树的实现
  6. Transact-SQL 语法约定
  7. golang获取u盘序列号(通过读取注册表实现)
  8. mysql存储过程中like用法
  9. 基于Tight VNC的远程协助功能的实现
  10. python程序判断梅森素数_完美数与梅森素数Python