python抓取网页内容到excel_Python实现抓取网页生成Excel文件的方法示例
本文实例讲述了Python实现抓取网页生成Excel文件的方法。分享给大家供大家参考,具体如下:
Python抓网页,主要用到了PyQuery,这个跟jQuery用法一样,超级给力
示例代码如下:
#-*- encoding:utf-8 -*-
import sys
import locale
import string
import traceback
import datetime
import urllib2
from pyquery import PyQuery as pq
# 确定运行环境的encoding
reload(sys);
sys.setdefaultencoding('utf8');
f = open('gongsi.csv','w');
for i in range(1,24):
d = pq(url="http://www.yourwebname.com/?Code=HANGYELINGYU&myFlag=allShow&SiteID=122&PageIndex=%d"%(i));
itemsa=d('dl dt a') #取title元素
itemsb=d('dl dd') #取title元素
for j in range(0,len(itemsa)):
f.write("%s,\"%s\"\n"%(itemsa[j].get('title'),itemsb[j*2].text));
#end for
#end for
f.close();
接下来就是用Notepad++打开gongsi.csv,然后转成ANSI编码格式,保存。再用Excel软件打开这个csv文件,另存为Excel文件
希望本文所述对大家Python程序设计有所帮助。
python抓取网页内容到excel_Python实现抓取网页生成Excel文件的方法示例相关推荐
- 用python生成excel文件_python通过openpyxl生成Excel文件的方法
本文实例讲述了python通过openpyxl生成Excel文件的方法.分享给大家供大家参考.具体如下: 使用前请先安装openpyxl: easy_install openpyxl 通过这个模块可以 ...
- python将字典导入excel_python将字典列表导出为Excel文件的方法
将如下的字典列表内容导出为Excel表格文件形式: 关于上图字典列表的写入,请参考文章:https://www.jb51.net/article/169088.htm python将字典列表导出为Ex ...
- python字典保存为excel_python将字典列表导出为Excel文件的方法
将如下的字典列表内容导出为Excel表格文件形式: python将字典列表导出为Excel文件的方法,如下所示: 1.安装python官方Excel库------xlwt 直接在终端进行安装即可: ...
- python列表导出excel_python将字典列表导出为Excel文件的方法
将如下的字典列表内容导出为Excel表格文件形式: python将字典列表导出为Excel文件的方法,如下所示: 1.安装python官方Excel库------xlwt 直接在终端进行安装即可:pi ...
- python根据excel生成报表_Python实现导出数据生成excel报表的方法示例
本文实例讲述了Python实现导出数据生成excel报表的方法.分享给大家供大家参考,具体如下: #_*_coding:utf-8_*_ import MySQLdb import xlwt from ...
- python中excel制作成绩报表,Python实现导出数据生成excel报表的方法示例
本文实例讲述了Python实现导出数据生成excel报表的方法.分享给大家供大家参考,具体如下: #_*_coding:utf-8_*_ import MySQLdb import xlwt from ...
- python将panadas写入excel_python pandas写入excel文件的方法示例
pandas读取.写入csv数据非常方便,但是有时希望通过excel画个简单的图表看一下数据质量.变化趋势并保存,这时候csv格式的数据就略显不便,因此尝试直接将数据写入excel文件. pandas ...
- python爬虫入门练习:BeautifulSoup爬取猫眼电影TOP100排行榜,pandas保存本地excel文件
传送门:[python爬虫入门练习]正则表达式爬取猫眼电影TOP100排行榜,openpyxl保存本地excel文件 对于上文使用的正则表达式匹配网页内容,的确是有些许麻烦,替换出现任何的差错都会导致 ...
- python爬取沪深所有股票数据并生成Excel文件
爬取沪深所有股票数据并生成Excel文件 一.分析需求 1.对于沪深两市的各只股票,获取其:'股票代码', '股票名称', '最高', '最低', '涨停', '跌停', '换手率', '振幅', ' ...
最新文章
- linux变量接收命令返回值,Linux Shell教程(一)
- word中如何删除顽固的空白页?
- KEIL、uVision 和 MDK 区别和联系
- jQuery Sizzle选择器(一)
- 在SAP云平台ABAP编程环境上编写第一段ABAP程序
- YBTOJ:彩球抽取(期望)
- 程序2:word count
- JavaScript编写了一个计时器
- Linux 后台开发运维人员常用的Linux命令汇总
- java第二季_Java入门第二季
- 远程580解锁bl工具_一年让你多挣4万的工具丨又增VIVO新款保资料解锁!
- c51单片机编程实例c语言,C51单片机C语言编程基础和实例
- Java虚拟机栈和本地方法栈
- 特网云服务器 Windows自动更新相关配置
- 记一次超好用下载器you-get复活
- 从0到1构建一个电商平台 – 开发篇(转)
- 苹果浏览器Safari
- umi首屏加载速度优化
- 计算机电源可调电阻,PC电源改可调电源
- Ubuntu 截图快捷键 gnome-screenshot 使用
热门文章
- vue .env文件配置使用
- Swift中 ... 和 .. 以及 ==与===
- 电大考试计算机应用基础考试试题,最新电大统考计算机应用基础试题知识点
- 河南省“第三届金盾信安杯“部分WP
- (转)微信小程序保存图片到相册
- 《Linux内核分析与实现》 第五周 读书笔记
- U盘格式化后能恢复数据吗?U盘删除的数据还能恢复吗
- Ubuntu server版本系统下安装显卡驱动过程详解
- Docker使用docker compose创建 轻量级私人云端相册 实时管理个人相片 控制相册访问权限 Lychee 部署搭建
- Java当中的定时器