相关用法:
xlwt库:官方文档
xlwt设置宽度:Widths & Heights with xlwt + Python

目的:获取所有书名和书价并存入Excel

完整代码:

# -*- coding: utf-8 -*-
"""
Created on Sat Aug 26 17:28:21 2017@author: 81294
"""import urllib
import os
import shutil
from bs4 import BeautifulSoup
import re
import xlwtdef getName(soup_packtpage,name):all_book_title = soup_packtpage.find_all("div", class_="book-block-title")for book_title in all_book_title:c = book_title.string.strip()name.append(c)  return namedef getPrice(soup_packtpage,price):all_book_price = soup_packtpage.find_all("div", class_="book-block-price-discounted ")all_book_prices = re.compile(u"\s+.\s+\d+.\d+")for book_price in all_book_price:book_prices = book_price.find_next(text=all_book_prices)d= book_prices.strip().replace(' ' ,'')price.append(d)return pricedef save_excel(book_name,books_price):filename = xlwt.Workbook()sheet = filename.add_sheet("sheet1", cell_overwrite_ok=True)sheet.write(0,0,"book_title")                       #写入书名sheet.write(0,1,"book_price")                       #写入书价for i in range(len(book_name)):sheet.write(i+1,0,book_name[i])sheet.write(i+1,1,books_price[i])path = 'E:\\packtpub\\'if os.path.isfile(path):          #判断路径是否为文件os.remove(path)               #删除指定路径的文件elif os.path.isdir(path):         #判断路径是否为目录shutil.rmtree(path, True)     #删除目录及目录内部的文件 os.mkdir(path)                    #创建目录path = path + "packtpub.COM.xls"first_col = sheet.col(0)          #设置宽度first_col.width = 256*70sec_col = sheet.col(1)sec_col.width = 256*10filename.save(path)               print("创建excel文件完成!")def main():all_html_name = []all_html_price = []for html in range(0,5064,12):url = "https://www.packtpub.com/all?search=&offset={0}&rows=&sort=".format(html)page = urllib.request.urlopen(url)soup_packtpage = BeautifulSoup(page,'html.parser')page.close()getName(soup_packtpage,all_html_name)          #获取书名getPrice(soup_packtpage,all_html_price)        #获取书价page_num = html / 12print("写入第{0}页".format(page_num+1))name = getName(soup_packtpage,all_html_name)price = getPrice(soup_packtpage,all_html_price)save_excel(name,price)                            #存入Excelmain()

结果:

python3爬虫简单小实例2.0相关推荐

  1. stm32简单小实例_煽动MCU/MPU市场,STM32的生态图

    导言: 蝴蝶扇动翅膀, 便可引发彼岸的暴风雨. STM32这只"蝴蝶"不仅掀起了MCU的风暴, 还走进了工程师和千家万户. 2020年STM32一年一度的全国巡回研讨会(STM32 ...

  2. stm32简单小实例_抓住蝶粉的心,STM32有“利器”

    尽管2020年注定是艰难的一年,但意法半导体STM32仍尽力为广大蝶粉提供了面对面沟通碰撞的机会. 9月13日-9月25日,为期13天的2020年意法半导体STM32全国巡回研讨会圆满落幕.作为工程师 ...

  3. stm32简单小实例_抓住蝶粉的心,STM32有“利器”!

    出品 21ic中国电子网 蔡璐 网站:21ic.com 尽管2020年注定是艰难的一年,但意法半导体STM32仍尽力为广大蝶粉提供了面对面沟通碰撞的机会.9月13日-9月25日,为期13天的2020年 ...

  4. Python3爬虫-01-简单网页爬取

    ''' 宇宙黑客王磊磊 Python3爬虫 简单网页的获取第一个简单的示例 爬去Hades 官网首页 '''import sys import urllib.request print(sys.get ...

  5. python3 爬虫回忆录

    整理于2020年11月下旬: It is tough today and tomorrow will be tougher.but the day after tomorrow is beautifu ...

  6. python3爬虫实例-python3.7简单的爬虫实例详解

    python3.7简单的爬虫,具体代码如下所示: #https://www.runoob.com/w3cnote/python-spider-intro.html #Python 爬虫介绍 impor ...

  7. python爬虫实例-python3.7简单的爬虫实例详解

    python3.7简单的爬虫,具体代码如下所示: #https://www.runoob.com/w3cnote/python-spider-intro.html #Python 爬虫介绍 impor ...

  8. python3.x简单爬虫(爬取百度壁纸图片下载本地)

    一.导读 python的火热大家都是有目共睹的,相信没有一个人不想学习这样牛逼哄哄的技术,无论是技术还是非技术人员.python的魅力太过于强大,今天我给大家介绍一下python3.x里面的一个简单小 ...

  9. Python3.5 网络爬虫简单入门

    一.网络爬虫简单介绍 网络爬虫(又被称为网页蜘蛛,网络机器人),是一种按照一定的规则,自动地抓取万维网信息的程序或者脚本.另外一些不常使用的名字还有蚂蚁.自动索引.模拟程序或者蠕虫. 相对于通用网络爬 ...

最新文章

  1. 为什么要把进程/线程绑定到特定cpu核上运行?(cpu core id coreIdx)opdevsdk_sys_bindThreadCoreId()
  2. K8S Deployment脚本部署Tomcat集群
  3. 【转载】 quartus中调用modelsim仿真的方法
  4. 玩转oracle 11g(28):ora-00064和程序异常终止
  5. bash获得相对路径的文件信息
  6. 物联网能为企业做点什么?
  7. list的一些常见用法总结(实用干货收藏)
  8. 沟通管理-输入、输出、工具和技术
  9. 一.python实现AI拟声---pycharm工具下载及python环境配置
  10. selenium3填坑
  11. 一个喷嚏就能传播病毒?关于病毒,还有多少是你不知道的?
  12. 作为SLAM中最常用的闭环检测方法,视觉词袋模型技术详解来了
  13. 微博的10大特征包括哪些?
  14. 经典蓝牙与低功耗蓝牙的区别
  15. 在html中控制自动换行 1
  16. u大侠pe系统桌面计算机,更换winpe桌面壁纸的详细教程
  17. HIS接口--LIS 与 HIS 跳转URL
  18. Hexo+Github搭建个人博客和个人主页
  19. 2011年12月1日-2021年12月4日
  20. 有啊百度知道双色球红蓝走势图

热门文章

  1. java局部网内通话杂音_吞咽时盖住喉口,防止食物误入喉腔的喉软骨是
  2. 基于python文本挖掘实战_python实现CNN中文文本分类
  3. “经历了人生百态世间的冷暖,这笑容温暖纯真”
  4. 计算机网络:无线局域网
  5. CPU性能测试工具-Unixbench
  6. s_gets()函数解析
  7. sd和sem啥区别_标准差和标准误的选择 (SD) 和 (SEM)
  8. 谭八爷系统模式的探讨
  9. 学习C++的常用网站
  10. Android Studio Canvas 实现鼠标贝塞尔曲线拖尾特效(富文本编辑器)