3.CSV文件存储

CSV 全称 Comma-Separated Values 中文叫做逗号分隔值或者字符分隔值,文件以纯文本形式存储表格数据。
文件是一个字符序列 可以由任意数目的记录组成相当于一个结构化表的纯文本形式,它比Excel更加简洁,
XLS文本是电子表格,包含文本,数值,公式和格式等内容,CSV都没有 就是特定的字符分隔纯文本,结构简单清晰。

3.1 写入

示例:

import csvwith open('data.csv','w') as csvfile:
writer = csv.writer(csvfile)#初始化写入对象
writer.writerow(['id','name','age'])#传入每行数据
writer.writerow(['10001','mike',20])
writer.writerow(['10002','bod',22])
writer.writerow(['10003','jordan',21])

更改列与列之间分隔符 可以传入 delimiter参数 记得关闭文件

示例:

import csvwith open('data.csv','w') as csvfile:
writer = csv.writer(csvfile,delimiter=' ')#初始化写入对象
writer.writerow(['id','name','age'])#传入每行数据
writer.writerow(['10001','mike',20])
writer.writerow(['10002','bod',22])
writer.writerow(['10003','jordan',21])

同时写入多行 参数为二位列表

import csvwith open('data.csv','w') as csvfile:
writer = csv.writer(csvfile)#初始化写入对象
writer.writerow(['id','name','age'])#传入每行数据
writer.writerows([['10001','mike',20],['10002','bod',22],['10003','jordan',21]])

一般情况下 爬虫爬取的都是结构化数据 一般会用字典来表示 csv库也提供了字典的写入方式

示例:

import csvwith open('data.csv','w') as csvfile:
fieldname = ['id','name','age']#定义字段
writer = csv.DictWriter(csvfile,fieldnames=fieldname)#初始化字典写入对象
writer.writeheader()#写入头信息
writer.writerow({'id':'10001','name':'mike','age':20})
writer.writerow({'id':'10002','name':'bod','age':22})
writer.writerow({'id':'10003','name':'jordan','age':21})

输入中文 给 open() 加入参数 encoding='utf-8'

示例:

import csvwith open('data.csv','a',encoding='utf-8') as csvfile:
fieldname = ['id','name','age']#定义字段
writer = csv.DictWriter(csvfile,fieldnames=fieldname)#初始化字典写入对象
writer.writerow({'id':'10004','name':'小米','age':20})

3.2 读取

示例:

import csvwith open('data.csv','r',encoding='utf-8') as csvfile:
reader = csv.reader(csvfile)
for row in reader:
print(row)

在做数据分析时此种方法用的比较多,也是一种常用的数据存储方式,需要熟练掌握。

转载于:https://www.cnblogs.com/liuxiaosong/p/10337133.html

Python3编写网络爬虫10-数据存储方式三-CSV文件存储相关推荐

  1. [ Android 五种数据存储方式之二 ] —— 文件存储数据

    关于文件存储,Activity提供了openFileOutput()方法可以用于把数据输出到文件中,具体的实现过程与在J2SE环境中保存数据到文件中是一样的. 文件可用来存放大量数据,如文本.图片.音 ...

  2. Python3编写网络爬虫04-爬取猫眼电影排行实例

    利用requests库和正则表达式 抓取猫眼电影TOP100 (requests比urllib使用更方便,由于没有学习HTML系统解析库 选用re) 1.目标 抓取电影名称 时间 评分 图片等 url ...

  3. 使用python编写网络爬虫

    使用python编写网络爬虫 前言 1.为何使用爬虫 2.编写爬虫的知识要求 3.确定爬虫使用的工具库 4.确定要获取的数据集 4.1 分析Url地址变化 4.2 获取目标数据集所在的HTML区域 5 ...

  4. Python实验1——网络爬虫及数据可视化

    Python实验1--网络爬虫及数据可视化 一.实验目标与基本要求 实验目标 基本要求 二.主要知识点.重点与难点 主要知识点 重点 难点 三.实验过程设计 获取网页 获取数据 保存到数据库 数据预处 ...

  5. Python学习——(2)通过网络爬虫获取数据

    通过网络爬虫获取数据 1. 和爬虫有关的HTTP ​ HTTP是网络数据通信的基础.在本节中会围绕Python网络爬虫讲述常用HTTP知识点. 1.1 基于HTTP的请求处理流程 ​ 当用户在浏览器的 ...

  6. 关于使用Python3进行网络爬虫的字符问题

    使用Python3进行网络爬虫的时候,对于某一些网页,使用utf-8编码是没有问题的.比如: import urllib.request url = "https://www.baidu.c ...

  7. 用c语言实现网络爬虫,C语言编写网络爬虫

    C语言编写网络爬虫 #include #include #include #include #pragma comment(lib, "ws2_32.lib")//加载网络支持的库 ...

  8. 22.网络爬虫—APP数据抓取详讲

    网络爬虫-APP数据抓取详讲 Fiddler 工作原理 安装完成Fiddler后的配置 前提条件 工具配置 手机数据抓取 Fiddler手机端配置 手机端操作 实战演示 后记 前言:

  9. 练习:selenium 爬取京东的电脑商品100页的数据并保存到csv文件中

    练习:selenium 爬取京东的电脑商品100页的数据并保存到csv文件中 from selenium.webdriver import Chrome, ChromeOptions import t ...

最新文章

  1. 人生苦短,我用Python——Life is short, You need Python
  2. STL:priority_queue
  3. 算法 --- 翻转二叉树
  4. linux 内核代码构架图
  5. Linux命令整合之find
  6. 6.Strings and Dictionaries
  7. cuda tensorflow版本对应_Windows10下安装tensorflow-gpu(2.2.0)安装教程(避坑+保姆式教学)...
  8. 【跃迁之路】【593天】程序员高效学习方法论探索系列(实验阶段350-2018.09.21)...
  9. c语言宏 转换字符串,c预处理程序-如何从C宏的值生成char字符串?
  10. js 数组 改变长度_Java数组,什么是Java数组?Java数组学习
  11. 国防科大登顶SQuAD 2.0排行榜,机器阅读也要“不知为不知”
  12. easyui datagrid 遇到的坑 cannot read property ·· pageNum bug and so on
  13. 期待人工智能在合作时的表现
  14. python实现将android手机通讯录vcf文件转化为csv
  15. 设计模式-Adapter模式(适配器模式)
  16. 崩溃!因对领导不满前网管离职后远程入侵服务器,致诊疗系统瘫痪!
  17. 抖音5×5一笔连线问题无解的证明
  18. 高通骁龙MSM8916核心板 ARM Cortex-A53 四核 中文资料
  19. 口渴·冰绿茶心情 -旧文
  20. 等了十年的微信功能终于成真

热门文章

  1. 蓝桥杯 ADV-149 算法提高 特殊的质数肋骨
  2. 蓝桥杯 ALGO-89 算法训练 字符删除
  3. [Java] 蓝桥杯ALGO-99 算法训练 薪水计算
  4. 简单的busybox创建_用busybox构建一个最小根文件系统
  5. Spring mvc创建的web项目,如何获知和修改其web的项目访问链接名称?
  6. Centos 7.4版本升级内核3.10+ 到4+过程
  7. openstack ha 部署
  8. centos 6.7 安装php7
  9. 洛谷 P1118 数字三角形游戏 Label:dfs
  10. wince6-Error: failed PB timebomb check