利用Python进行数据分析之 数据加载

“ ” “ ” 数据加载,存储与文件格式 1,读写文本格式数据: (read_csv,read_table,read_fwf,read_clipboard,open() to_csv,to_excel,write()) 2, JSON数据: (两个方法:json.loads() json.dumps()) 3,XML和HTML:WEB信息收集(两个接口lxml.html, lxml.objectify) 4,二进制数据格式(pickle函数,短期存储格式) 5,使用HTML和WEB API(requests包) 6,使用数据库 目录 读取文本格式数据 read_csv 从文件,url,文件型对象中加载带分隔符的数据,默认分隔符为逗号。 read_table 从文件,url,文件型对象中加载带分隔符的数据,默认分隔符为制表符('\t')。 read_fwf 读取定宽格式的数据,无分隔符 read_clipboard 读取剪贴板中数据 读取文本格式数据 pandas读取文件会自动推断数据类型,不用指定。 以read_csv为例,下面是常用的几个参数: 用 names重新规定列名,用index_col指定索引,也可以将多个列组合作为层次化索引。 可以编写正则表达式规定分隔符。 用skiprows跳过某些行。 缺失数据要么没有,要么用某个标记值表示,pandas常用NA、-1.#IND、NULL等进行标记。 用na_values用来不同的NA标记值。 Nrows 只读取几行 Chunksize:逐块读取文件 定义一个字典为各个列指定NA标记值,直接=null的就是把df中所有为空值的都标为null 跳过第3行 将数据写出到文本格式 1、利用data_frame的to_csv方法,可以将数据写到一个以逗号分隔的文件中,也可用sep参数指定分隔符,如 data.to_csv() 2、缺失值写入输出时会被表示为空字符串,可使用na_rep表示为别的标记值。 不添加后缀的话默认是一个file文件 data.to_csv(sys.stdout, sep='|') # 打印到屏幕 data.to_csv(sys.stdout, na_rep='NULL') # 空字符处显示为NULL data.to_csv(sys.stdout, index=False, header=False) # 禁用行和列的标签 data.to_csv(sys.stdout, cols=['a', 'b', 'c']) # 按照指定的顺序显示列 sys.stdout就相当于print,使用之前要import JSON数据 JSON数据已经成为通过http请求在wed浏览器和其他应用程序之间发送数据的标准格式之一,它是一种比表格型文本格式更灵活的数据格式。JSON非常接近于有效的python代码,基本类型都有对象,数组,字符串,数值,布尔型以及null。 Python形式 JSON格式 JSON格式 json.loads() json.dumps() Html基本信息 HTML 使用标记标签来描述网页 HTML 文档描述网页 保存为后缀名带.html打开就是一个网页 a href 超链接 XML和HTML:WEB信息收集 Python有许多可以读写HTML和XML格式数据的库,lxml就是其中之一。 XML和HTML:WEB信息收集 Python有许多可以读写HTML和XML格式数据的库,lxml就是其中之一。 from lxml.html import parse from urllib.request import urlopen urllib2在python中是urllib.request from pandas.io.parsers import TextParser import pandas as pd parsed=parse(urlopen(‘/rank/capitalforsale.html’)) 打开url doc=parsed.getroot() 可以得到url里面所有的element print('---------doc-----------') print (doc) links=doc.findall(‘.//a’) 获取所有为 的超链接 lnk=links[3]

python录入数据至ppt_利用Python进行数据分析之 数据加载.ppt相关推荐

  1. python录入数据至ppt_利用python分析weibo数据做成图表放入PPT中

    起因 很久以前,就有个想法,就是自动分析微博的数据,但是之前一直想的是网页版展示,flask想学了好久都没学,偶然的一次看到了一篇关于python处理pptx的文章,再加上同窗三年的室友在毕业后竟然主 ...

  2. 数据可视化:利用Python和Echarts制作“用户消费行为分析”可视化大屏

    数据可视化:利用Python和Echarts制作"用户消费行为分析"可视化大屏 前言 实验目的: 准备工作: 一.创建项目: 二.建立数据库连接获取数据: 三.页面布局: 四.下载 ...

  3. 基于BC95的数据转发,利用Python实现UDP接收数据,TCP转发数据

    基于BC95的数据转发,利用Python实现UDP接收数据,TCP转发数据 文章信息 环境信息 系统概览 基于Python的UDP(服务端)数据接收 1. UDP接受的数据如何读取 文章信息 撰写日期 ...

  4. 【Python有趣打卡】利用pandas完成数据分析项目(二)——爬微信好友+分析

    今天依然是跟着罗罗攀学习数据分析,原创:罗罗攀(公众号:luoluopan1) Python有趣|数据可视化那些事(二) 今天主要是学习pyecharts(http://pyecharts.org/# ...

  5. python爬虫怎么挣钱-个人利用Python爬虫技术怎么挣钱

    在下写了5,.6年Python,期间写了各种奇葩爬虫,挣各种奇葩的钱,写这篇文章总结下几种爬虫挣钱的方式. 1.最典型的就是找爬虫外包活儿. 这是网络爬虫最通常的的挣钱方式,通过外包网站,熟人关系接一 ...

  6. 利用Crowbar抓取网页异步加载的内容 [Python俱乐部]

    利用Crowbar抓取网页异步加载的内容 [Python俱乐部] 利用Crowbar抓取网页异步加载的内容 [Python俱乐部] 利用Crowbar抓取网页异步加载的内容 在做 Web 信息提取.数 ...

  7. python翻页功能url不变_爬取Ajax动态加载和翻页时url不变的网页

    这两天投了一家公司的爬虫实习生,笔试题是完成一个爬虫的小需求.网站没有什么反爬的高级技巧.但是有非常常见的,并不是针对我们爬虫的,却让我们新手很难理解的ajax动态加载技术和乍一看不明白的翻页时不变的 ...

  8. 利用 JQuery的load函数动态加载页面

    利用JQuery的load函数动态加载页面 JQuery有好多Ajax函数,其中load是用来动态加载一个页面的内容到指定的dom元素上. 我们来做个例子: 做一个上下(左右)结构的页面,其中下左部分 ...

  9. 大数据实战-callLog项目(通话记录数据分析)之数据生产

    文章目录 前言 生成基础数据 Maven依赖 姓名-手机号列表 时间维度表 自动随机生成 生成时间戳 生成一定范围内的long数据 代码 调用演示 获得随机的时间戳 代码 调用示例 生成一行记录 打包 ...

最新文章

  1. 【BIO】基于BIO实现简单动态HTTP服务器
  2. Dynamics CRM2016 新功能之Solution enhancements
  3. STM32之定时器中断控制LED闪烁
  4. 《高性能MySQL》第5章 创建高性能的索引
  5. Java基础教程【第四章:Java流程控制】
  6. python+HEG对mod021km数据进行几何校正、辐射定标
  7. SDN第六次上机作业
  8. shader篇-立方体纹理
  9. UTM投影分带标准及投影转换
  10. 只要400行代码就能自已实现一个绘图机原型固件,esp8266 + micropython 用3d打印机改的绘图机
  11. 2018四川省排名前十的卫校名单有哪些?
  12. CLOB与BLOB的区别及用途
  13. 惠普27亿美元收购3Com 两大硬件巨头竞争升级
  14. 莫言出力、章泽天站台!京东百万豪奖作家背后是文娱野心
  15. Siri怎么重置主人声音
  16. Python面向对象编程---多态
  17. Revit二次开发小技巧(十六)寻找最短路径
  18. AutoML-第二章-元学习
  19. Tomcat配置路径
  20. 直播视频app源码的靓号可以怎样实现?

热门文章

  1. 最新iOS高薪面试必备要点总结
  2. 国外LEAD赚钱的一些习惯
  3. 微信小程序设置解锁密码
  4. 添加航班信息c语言,c语言编写航班查询代码
  5. 数字地球与计算机技术联系,数字地球与现代测绘科学的发展问题
  6. CTF|pwn栈溢出入门题level3解题思路及个人总结
  7. 易基因|Science:单细胞甲基化测序鉴定哺乳动物的新神经元亚型和调节元件
  8. 寒江独钓 第二章(3)Hook分发函数和回调函数
  9. 浙江省计算机程序比赛员,计算机学子在“图森未来杯”第十七届浙江省大学生程序设计竞赛中斩获金奖...
  10. 晏殊几何学讲义(思维导图)