【练习】爬取当当网中的好评榜图书信息，显示并保存为excel文件

声明：
1、学生刚开始学习爬虫，代码会有很多不严谨，也较为粗糙，单纯用于广大网友参考，希望能起到一定的帮助
2、如果要转载，请标记出来源
3、本文纯粹用于技术练习，请勿用作非法途径
做题途中所遇问题：
1.同class名的div标签想要单独取用第二个。但是一直没法，最后使用find_all标签一起取用成列表格式，再进行选取
2.for循环嵌套有点不熟悉折腾好久才弄清楚循环，基础不扎实。
代码行：

import requests
from bs4 import BeautifulSoup
import xlwt
response=requests.get("http://bang.dangdang.com/books/fivestars/1-1")
response.encoding=response.apparent_encoding
#由于要先爬取数据再保存成文件，运用函数来分布功能，方便管理
bs = BeautifulSoup(response.text,"html.parser")
book_content=bs.find('ul',class_="bang_list clearfix bang_list_mode").find_all('li')
list=[]
for book in book_content:#图书名name=book.find('div',class_="name").find('a').text#评分score=book.find('div',class_="biaosheng").text#作者author=book.find('div',class_="publisher_info").find('a').attrs['title']#出版日期time=book.find_all('div',class_="publisher_info")time=time[1].find('span').text#出版社address=book.find_all('div', class_="publisher_info")address=address[1].find('a').text#价格price=book.find_next('div', class_="price").find('p').find('span',class_='price_n').textbooks = (name,author, score, time, address, price)list.append(books)#       print(list)print("图书名:%s、作者:%s、评分:%s、出版日期:%s出版社:%s 价格:%s"%(name,author,score,time,address,price))
#1新建一个工作簿
workbook=xlwt.Workbook()
#2新建一个工作表
sheet1=workbook.add_sheet('当当网',cell_overwrite_ok=True)
col=("图书名","作者","评分","出版日期","出版社","价格")
for i in range(0,6):sheet1.write(0,i,col[i])
#行数
#循环嵌套，先进行外循环，进入内循环，内循环循环结束，再回到外循环，进入内循环
for i in range(0,len(list)):
#先将一本书的信息从储存所有书中的表中分离出来list2=list[i]#列数for j in range(0,6):
#然后再将这本书的信息分别割出来sheet1.write(i+1,j,list2[j])
workbook.save('newExcel.xls')

输出结果：

【练习】爬取当当网中的好评榜图书信息，显示并保存为excel文件相关推荐

python爬虫案例-爬取当当网数据
输入关键字,爬取当当网中商品的基本数据,代码如下: 1 # Author:K 2 import requests 3 from lxml import etree 4 from fake_userag ...
爬虫百战（一）：爬取当当网Top500本五星好评书籍
爬取当当网Top500本五星好评书籍 ==实战前提:== 准备工作撸代码成果展示实战前提: 掌握requests库的使用熟悉re库,正则表达式的简单使用可参考我的另外两篇博客进行学习准备工 ...
python爬虫06 | 你的第一个爬虫，爬取当当网 Top 500 本五星好评书籍
来啦,老弟我们已经知道怎么使用 Requests 进行各种请求骚操作也知道了对服务器返回的数据如何使用正则表达式来过滤我们想要的内容 ... 那么接下来我们就使用 requests 和 re ...
python爬虫什么书好_python爬虫入门06 | 爬取当当网 Top 500 本五星好评书籍
来啦,老弟 image 我们已经知道怎么使用 Requests 进行各种请求骚操作也知道了对服务器返回的数据如何使用正则表达式来过滤我们想要的内容 - 那么接下来我们就使用 requests ...
Python爬虫离线爬取当当网畅销书Top500的图书信息
本实例还有另外的在线爬虫实现,有兴趣可点击在线爬取当当网畅销书Top500的图书信息爬虫说明 1.使用requests和Lxml库爬取,(用BS4也很简单,这里是为了练习Xpath的语法) 2.爬虫 ...
Python爬虫在线爬取当当网畅销书Top500的图书信息
本实例还有另外的离线爬虫实现,有兴趣可点击离线爬取当当网畅销书Top500的图书信息爬虫说明 1.使用requests和Lxml库爬取,(用BS4也很简单,这里是为了练习Xpath的语法) 2.爬虫 ...
在当当买了python怎么下载源代码-爬虫实战：爬取当当网所有 Python 书籍
来源:公众号-极客猴出处: 本文主要讲解如何利用urllib.re.BeautifulSoup 这几个库去实战,爬取当当网所有 Python 书籍. 1 确定爬取目标任何网站皆可爬取,就看你要不要 ...
Scarpy爬取当当网书籍
目录 1:Scarpy (1) Scrapy是什么: (2)安装scrapy: 2.scrapy项目的创建以及运行 1.创建scrapy项目: 2.项目组成: 3.创建爬虫文件 4.爬虫文件的基本组 ...
python爬取当当网商品评论
python爬取当当网商品评论本案例获取某鞋评论作为例案例目的: 通过爬取当当网商品评价,介绍通过结合jsonpath和正则表达式获取目标数据的方法. 代码功能: 输入爬取的页数,自动下载保存每页 ...

【练习】爬取当当网中的好评榜图书信息，显示并保存为excel文件

【练习】爬取当当网中的好评榜图书信息，显示并保存为excel文件相关推荐

最新文章

热门文章