利用python进行数据加载和存储
1、文本文件
(1)pd.read_csv加载分隔符为逗号的数据;pd.read_table从文件、URL、文件型对象中加载带分隔符的数据。默认为制表符。(加载为DataFrame结构)
参数names指定列名,index_col用作行索引的列名或列编号,header用作列名的行号。
(2)利用DataFrame的to_csv方法,将数据写入到文件。
(3)import csv利用csv.reader读取已打开的文件对象;csv.writer方法写入数据。
2、json数据
import json
json.loads()将json数据加载为python对象;json.dumps()将python对象转换为json格式。
3、html
from lxml.html import parse
from urllib2 import urlopen
利用urlopen将希望获取数据的url打开,然后用parse解析得到的数据流。
from pandas.io.parses import TextParser(自动类型转换)
4、xml
利用lxml.objectify解析,from lxml import objectify
parsed=objectify.parse(open(path))
5、二进制格式
将数据以pickle形式保存到磁盘用save方法,frame.save(path)
pd.load(path)将数据读回python
6、excel文件
pd.ExcelFile(path)读取xls或xlsx文件.(预先要安装xlrd和openpyxl包)
7、web API
import requests
import json
data=json.loads(requests.get(url).text)
8、数据库
sqlite3、pyodbc、mysqldb、pymysql等;非关系型pymongo
转载于:https://www.cnblogs.com/zhenpengwang/p/10762790.html
利用python进行数据加载和存储相关推荐
- python实时数据存储与显示_利用python进行数据加载和存储
1.文本文件 (1)pd.read_csv加载分隔符为逗号的数据:pd.read_table从文件.URL.文件型对象中加载带分隔符的数据.默认为制表符.(加载为DataFrame结构) 参数name ...
- 《利用Python进行数据分析·第2版》第6章 数据加载、存储与文件格式
第1章 准备工作 第2章 Python语法基础,IPython和Jupyter 第3章 Python的数据结构.函数和文件 第4章 NumPy基础:数组和矢量计算 第5章 pandas入门 第6章 数 ...
- 利用Python进行数据分析(四):数据加载、存储与文件格式
标题利用Python进行数据分析(四):数据加载.存储与文件格式 学习笔记来源于:简书https://www.jianshu.com/p/047d8c1c7e14 输入输出通常可以划分为几个大类:读取 ...
- 《利用python进行数据分析》——第6章 数据加载、存储与文件格式——读书笔记
第6章 数据加载.存储与文件格式 6.1 读写文本格式的数据 pandas提供了一些用于将表格型数据读取为DataFrame对象的函数. 其中read_csv和read_talbe用得最多 panda ...
- Python之pandas数据加载、存储
Python之pandas数据加载.存储 0. 输入与输出大致可分为三类: 0.1 读取文本文件和其他更好效的磁盘存储格式 2.2 使用数据库中的数据 0.3 利用Web API操作网络资源 1. 读 ...
- python数据分析实例_python数据分析实例3-商铺数据加载及存储
商铺数据加载及存储 在data文件夹存放有商铺数据.csv文件,路径:path = '../data/商铺数据.csv' 要求: 1.成功读取"商铺数据.csv"文件,并展示打印出 ...
- pandas入门(6)——数据加载、存储与文件格式
pandas入门(6)--数据加载.存储与文件格式 输入输出通常可以划分为几个大类:读取文本文件和其他更高效的磁盘存储格式,加载数据库中的数据,利用Web API操作网络资源 一.读取文本格式数据 函 ...
- 【数据分析项目实战】商铺数据加载及存储
''' [项目] 商铺数据加载及存储要求: 1.成功读取"商铺数据.csv"文件 2.解析数据,存成列表字典格式:[{'var1':value1,'var2':value2,'va ...
- pandas数据加载与存储
提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 文章目录 前言 一.pandas是什么? 二.数据加载与存储 1.引入库 2.读入数据 2.1 读取Excel文件 2.2 读取 tx ...
- 数据加载、存储与文件格式(python)
文章目录 6.1 读写文本格式的数据 逐块读取文本文件 将数据写出到文本格式 JSON 数据 访问数据是使用本书所介绍的这些工具的第一步.我会着重介绍 pandas 的数据输入与输出,虽然别的库中也有 ...
最新文章
- noip复赛普及组2020_我校学子在2020年“外研社·国才杯”全国英语写作大赛(高职组)复赛中斩获佳绩...
- 【机器学习】信用卡欺诈检测|用启发式搜索优化XGBoost超参数
- 容器编排技术 -- Kubernetes 为 Namespace 配置CPU和内存配额
- 从折叠屏到AR 三星Galaxy新品预热宣传片大招频现
- bootstrap table 服务器端分页例子
- 再谈System.arraycopy和Arrays.copyOf
- 搭建自己的博客(二十):优化博客评论功能
- FPGA中亚稳态相关问题及跨时钟域处理
- js手写车牌输入键盘
- mysql drop语句怎么用_SQL DROP 语句
- 使用七牛云存储解决ios7.1的app部署问题
- Python超级详细的上台阶楼梯问题,算法运行速度极快,内含计算排列的方法。问题:有n级台阶,每步可以走一级或两级,问有多少种不同的走法。k为传入的参数,默认值为3
- 语言缩写c-a,常见的国家语言缩写以及语言的代码
- CVPR 2021 自动驾驶相关论文解读
- 计算机管理无法格式化硬盘,无法选择或格式化硬盘分区 - Windows Server | Microsoft Docs...
- 被限制的ckplayer播放器如何实现倍速播放和快进
- 基于android的航班查询飞机票订购系统app
- 2010年考研完全攻略手记
- Python模块:subprocess模块教程
- 大模型综述来了!一文带你理清全球AI巨头的大模型进化史
热门文章
- 【基础教程】基于matlab图像质量评价综述【含Matlab源码 075期】
- php检查数组下标是否,php检查数组下标是否存在
- python查看数据库存在表_python sqlite3查看数据库所有表(table)
- ubuntu mysql 5.0_ubuntu server 8.04 下的mysql5.0的集群实验
- axure树与表格结合_语言开发7:语言迟缓孩子,家庭日常训练,干货满满!【附:表格及图片】...
- centos 安装mysql5.6.22_CentOS 6.4 安装MySQL 5.6.22
- c++ map 修改value_深度解密Go语言之map
- php 实现静态链接,在PHP中链接静态方法?
- ideal如何用标签输出_实战|如何使用JavaScript访问设备前后摄像头
- c( )函数--R语言