导读:数据分析将作为一门通用技能,进入越来越多的不同工作中。毕竟“技多不压身”,掌握数据分析,一方面可以提升自己相应的业务能力,另一方面也可以让自己建立一种从数据出发的视角,用大数据思维去思考各种问题。

作者:老A

如需转载请联系大数据(ID:hzdashuju)

Excel里面的透视表(Pivot Table)确实是做数据分析的必备技能。透视表可以帮你迅速汇总数据,看到各类型数据的直观特征就像是让你站在了一个更高的视角上去看你的数据。作为进阶,Excel自带的函数,各种插件,以及VBA也是很好的工具。

但当数据量大到用Excel打开都要好久,电脑打开文件都会死机的时候,这种也就不适合用office工具了,也或者我们想进一步提升能力的时候,需要学习一些hardcore技能,即用编程语言做数据分析。

这里主要有R和Python两大流派。我个人推荐Python,一方面Python代码简单易懂,容易上手;另一方面学习资料超级多。关于Python的学习资料,这里我推荐《利用Python进行数据分析》,这本书涵盖了利用Python做数据清洗,数据可视化及分析的技能点,可以作一本参考书、工具书,也可以对着书里面的案例进行实操。

受这本书的启发,我写了下面是几个处理Excel的小程序,仅供大家参考学习数据分析和数据从Excel中获取数据。Python对Excel的读写主要有xlrd、xlwt、xlutils、openpyxl、xlsxwriterp这几个形式。具体的安装方法可以从网上查一下,然后导入Python中就可以使用了。

1. xlrd主要是用来读取excel文件

import xlrdworkbook = xlrd.open_workbook(u' Python进行数据分析测试.xls')sheet_names= workbook.sheet_names()for sheet_name in sheet_names:   sheet2 = workbook.sheet_by_name(sheet_name)   print sheet_name rows = sheet2.row_values(1)    cols = sheet2.col_values(1)    print rows   print colsworkbook = xlrd.open_workbook(u' Python进行数据分析测试.xls')sheet_names= workbook.sheet_names()for sheet_name in sheet_names:   sheet2 = workbook.sheet_by_name(sheet_name)   print sheet_name rows = sheet2.row_values(1)    cols = sheet2.col_values(1)    print rows   print cols

2. xlwt主要是用来写excel文件

import xlwtwbk = xlwt.Workbook()sheet = wbk.add_sheet('sheet 1')sheet.write(0,1,'test text')#第0行第一列写入内容wbk.save('test.xls')wbk = xlwt.Workbook()sheet = wbk.add_sheet('sheet 1')sheet.write(0,1,'test text')#第0行第一列写入内容wbk.save('test.xls')

3. xlutils结合xlrd可以达到修改excel文件目的

import xlrdfrom xlutils.copy import copyworkbook = xlrd.open_workbook(u' Python进行数据分析测试.xls')workbooknew = copy(workbook)ws = workbooknew.get_sheet(0)ws.write(3, 0, 'changed!')workbooknew.save(u' Python进行数据分析测试copy.xls')from xlutils.copy import copyworkbook = xlrd.open_workbook(u' Python进行数据分析测试.xls')workbooknew = copy(workbook)ws = workbooknew.get_sheet(0)ws.write(3, 0, 'changed!')workbooknew.save(u' Python进行数据分析测试copy.xls')

4. openpyxl可以对excel文件进行读写操作

from openpyxl import Workbookfrom openpyxl import load_workbookfrom openpyxl.writer.excel import ExcelWriter workbook_ = load_workbook(u" Python进行数据分析测试.xlsx")sheetnames =workbook_.get_sheet_names() print sheetnamessheet = workbook_.get_sheet_by_name(sheetnames[0])print sheet.cell(row=3,column=3).valuesheet['A1'] = '47' workbook_.save(u" Python进行数据分析测试新.xlsx")  wb = Workbook()ws = wb.activews['A1'] = 4wb.save("检索.xlsx") import Workbookfrom openpyxl import load_workbookfrom openpyxl.writer.excel import ExcelWriter workbook_ = load_workbook(u" Python进行数据分析测试.xlsx")sheetnames =workbook_.get_sheet_names() print sheetnamessheet = workbook_.get_sheet_by_name(sheetnames[0])print sheet.cell(row=3,column=3).valuesheet['A1'] = '47' workbook_.save(u" Python进行数据分析测试新.xlsx")  wb = Workbook()ws = wb.activews['A1'] = 4wb.save("检索.xlsx") 

最后把《利用Python进行数据分析》这本书的内容再给大家介绍一下,书中含有大量的实践案例,讲解如何利用各种Python库(包括NumPy、pandas、matplotlib以及IPython等)高效地解决各式各样的数据分析问题。

由于作者Wes McKinney是pandas库的主要作者,所以这本书也可以作为利用Python实现数据密集型应用的科学计算实践指南,适合刚刚接触Python的分析人员以及刚刚接触科学计算的Python程序员。

  • 将IPython这个交互式Shell作为你的首要开发环境。

  • 学习NumPy(Numerical Python)的基础和高级知识。

  • 从pandas库的数据分析工具开始。

  • 利用高性能工具对数据进行加载、清理、转换、合并以及重塑。

  • 利用matplotlib创建散点图以及静态或交互式的可视化结果。

  • 利用pandas的groupby功能对数据集进行切片、切块和汇总操作。

  • 处理各种各样的时间序列数据。

  • 通过详细的案例学习如何解决Web分析、社会科学、金融学以及经济学等领域的问题。

关于作者:老A,项目管理师,专业兴趣研究方向:大数据、计算机软件、通信工程。个人业余爱好是研究无人机制作,银元鉴赏与收藏。

本文为「大数据」内容合伙人之「鉴书小分队」活动读书笔记,由大数据粉丝原创。

「大数据」内容合伙人之「鉴书小分队」上线啦!

最近,你都在读什么书?有哪些心得体会想要跟大家分享?

数据叔最近搞了个大事——联合优质图书出版商机械工业出版社华章公司发起鉴书活动。

简单说就是:你可以免费读新书,你可以免费读新书的同时,顺手码一篇读书笔记就行。详情请在大数据公众号后台对话框回复合伙人查看。

延伸阅读《利用Python进行数据分析(原书第2版)》

点击上图了解及购买

转载请联系微信:togo-maruko

推荐语:Python数据分析经典畅销书全新升级,第1版中文版累计销售100000册。针对Python 3.6进行全面修订和更新,涵盖新版的pandas、NumPy、IPython和Jupyter。

据统计,99%的大咖都完成了这个神操作

更多精彩

在公众号后台对话框输入以下关键词

查看更多优质内容!

PPT | 报告 | 读书 | 书单 | 干货

大数据 | 揭秘 | Python | 可视化

人工智能 | 机器学习 | 深度学习 | 神经网络

AI | 1024 | 段子 | 区块链 | 数学

猜你想看

  • 8个应用案例告诉你,机器学习都能做什么?

  • 从计算机视觉到人脸识别:一文看懂颜色模型、信号与噪声

  • 什么是Apache Spark?这篇文章带你从零基础学起

  • 如果数据有质量,地球将成黑洞?

Q: 最近你在读哪本书?

欢迎留言与大家分享

觉得不错,请把这篇文章分享给你的朋友

转载 / 投稿请联系:baiyu@hzbook.com

更多精彩,请在后台点击“历史文章”查看

点击阅读原文,了解更多

4段简短代码教你用Python读写Excel相关推荐

  1. 10行代码教你用Python扫描Excel表格,自动生成条形码!

    一.需求分析 条形码应用广泛,尤其是人事.财务和库管等等岗位,常需根据excel文件成批生成条码,如果是经常性天天做,用excel的自己控件还是很枯燥烦人的. 当然在学习Python的道路上肯定会困难 ...

  2. 基于python的证件照_20行代码教你用python给证件照换底色的方法示例

    1.图片来源 该图片来源于百度图片,如果侵权,请联系我删除!图片仅用于知识交流. 2.读取图片并显示 imread():读取图片: imshow():展示图片: waitkey():设置窗口等待,如果 ...

  3. python办公自动化excel_简直出神入化,教你用Python控制Excel实现自动化办公

    1.安装 简直出神入化,教你用Python控制Excel实现自动化办公 2.操作一个简单的Excel文档 操作注释及代码: 简直出神入化,教你用Python控制Excel实现自动化办公 操作完成后,数 ...

  4. python做excel自动化可视化-简直出神入化,教你用Python控制Excel实现自动化办公...

    1.安装 简直出神入化,教你用Python控制Excel实现自动化办公 2.操作一个简单的Excel文档 操作注释及代码: 简直出神入化,教你用Python控制Excel实现自动化办公 操作完成后,数 ...

  5. python excel 自动化-简直出神入化,教你用Python控制Excel实现自动化办公

    1.安装 简直出神入化,教你用Python控制Excel实现自动化办公 2.操作一个简单的Excel文档 操作注释及代码: 简直出神入化,教你用Python控制Excel实现自动化办公 操作完成后,数 ...

  6. python自动化办公-简直出神入化,教你用Python控制Excel实现自动化办公

    1.安装 简直出神入化,教你用Python控制Excel实现自动化办公 2.操作一个简单的Excel文档 操作注释及代码: 简直出神入化,教你用Python控制Excel实现自动化办公 操作完成后,数 ...

  7. 教你用python在excel中“画画”

    有意思系列----教你用python在excel中画画 一.废话不多说,先看看成品 二.实现思路 1.图片相关知识说明 位图: 位图由一个个像素点组成,每个像素点都有自己的颜色.而我们可以操纵这些像素 ...

  8. python读取excel文件代码封装_12行代码教会你用python读excel文件提取数据生成条形码...

    12 行代码教会你用 python 读 excel 文件,提取数据,生成 条形码 一.需求分析条形码应用广泛,尤其是人事.财务和库 管等等岗位,常需根据 excel 文件成批生成条码,如果是经 常性天 ...

  9. python简单代码编写-python读写Excel表格的实例代码(简单实用)

    安装两个库:pip install xlrd.pip install xlwt 1.python读excel――xlrd 2.python写excel――xlwt 1.读excel数据,包括日期等数据 ...

最新文章

  1. android edittext不可复制_Android EditText禁止复制粘贴
  2. 2016.6.23 随笔———— AJAX
  3. linux安装mysql的分支mariadb
  4. mysql使用 CONCAT(字段,字段) 函数拼接
  5. 第一百二十五期:程序员的自我救赎,使用Python开发性格分析工具
  6. 【2017年第2期】社交网络分析在公共安全领域的应用
  7. java 泛化_Java语言class类用法及泛化(详解)
  8. live555学习笔记-RTSP服务运作
  9. [No000094]SVN学习笔记4-版本库概念与部分日常操作
  10. Atitit 函数式编程与命令式编程的区别attilax总结  qbf
  11. 【HTML】Html页面跳转的5种方式
  12. 第三周助教工作总结——NWNU李泓毅
  13. 程序员之路:Gmail邮箱客户端配置
  14. Linux错误 “cp: omitting directory”解决办法
  15. Android的基本资源访问
  16. Value ‘0000-00-00 00:00:00‘ can not be represented as java.sql.Timestamp
  17. matlab可视化功能6,第6章MATLAB计算结果可视化
  18. 谷歌浏览器Chrome错误提示Flash过期怎么办(转)
  19. Scala中的集合排序
  20. ubuntu中截图工具shutter编辑按钮不可用

热门文章

  1. Qt工作笔记-QMap查找时要注意的问题(使用contains)
  2. arcmap中添加python脚本_基于Python脚本的ArcMap字段计算器分类赋值
  3. python输出矩阵的行数_python查看矩阵的行列号以及维数方式
  4. oracle分区存储过程示例,Oracle 存储过程示例
  5. 中山市区电信5g覆盖地图_热点 | 百度与中国电信达成战略合作 覆盖5G、互联网等领域...
  6. excel 单元格求和大于某个数后返回列号_Excel最常用的几个函数,我都帮你整理好了!...
  7. background 渐变_今日重点:April安卓渐变黑。| 明日日程:BUG修复。
  8. mysql配置连接远程_MySql配置远程访问
  9. jquery 给类名元素添加行内样式_学Jquery的第一天
  10. 对人工智能神经网络的认识