将淘宝爬取的数据写入Excel表格
我们上一篇文章已经获取到淘宝的数据写入了.json文件。现在我们就可以写入Excel表格。
运行结果是这样子的。
from selenium.webdriver import Chrome
import time
from lxml import etree
import json
import xlwt
#导包
if __name__ == '__main__':chrome_obj = Chrome()#因为是个类,所以要创建一个对象。chrome_obj.get('https://uland.taobao.com/sem/tbsearch?refpid=mm_26632258_3504122_32538762&keyword=%E5%A5%B3%E8%A3%85&clk1=ab1fdcf6365ee8bc6248263f22f49a33&upsId=ab1fdcf6365ee8bc6248263f22f49a33') # 往浏览器的网页地址栏填入淘宝网址#先定位到搜索框input_obj = chrome_obj.find_element_by_xpath('//*[@id="J_search_key"]').clear()# 输入搜索框数据input_obj = chrome_obj.find_element_by_xpath('//*[@id="J_search_key"]').send_keys('男装')#定位到点击搜索按钮click_obj = chrome_obj.find_element_by_xpath('//*[@id="J_searchForm"]/input')# 触发点击click_obj.click()# 页面等待,等待数据加载完毕time.sleep(2)# 获取源码数据html_data = chrome_obj.page_source# 数据的提取:html_obj = etree.HTML(html_data)# 商品名name_list = html_obj.xpath('//div/span[@class="title-text"]/text()')print(name_list)#商品销量sell_info = html_obj.xpath('//div/div[@class="sell-info"]/text()')print(sell_info)#商品价格//div/span[@class="coupon-price-afterCoupon"]/text()jiage = html_obj.xpath('//div/span[@class="coupon-price-afterCoupon"]/text()')print(jiage)book = xlwt.Workbook(encoding='utf-8', style_compression=0)#表格明如sheetsheet = book.add_sheet('淘宝', cell_overwrite_ok=True)#写出第一行的列col = ('商品名称', '价格', '销量')for i in range(0, 3):sheet.write(0, i, col[i])#将数据合并为一个列表,一个列表里面嵌套多个列表,我们不需要知道有多少,直接len(name_list)就可以知道有多少个dict_ = []for i in range(len(name_list)):dict_1 = [name_list[i], sell_info[i], jiage[i]]print(dict_1)dict_.append(dict_1)print(dict_)
#将数据以一个列表写入Excel表格for i in range(0, 60):data = dict_[i]for j in range(0, 3):sheet.write(i + 1, j, data[j])#这一步我们要在D:/python项目/ 这个目录下先新建一个叫taobao.xls的文件,不然会报错savepath = 'D:/python项目/taobao.xls'book.save(savepath)#打开文件后要关闭才能运行,不然会报权限不够的错误。#关闭浏览器chrome_obj.quit()
将淘宝爬取的数据写入Excel表格相关推荐
- Python爬虫项目:爬取JSON数据存储Excel表格与存储图片
随着网络的迅速发展,万维网成为大量信息的载体,如何有效地提取并利用这些信息成为一个巨大的挑战.搜索引擎(Search Engine),例如传统的通用搜索引擎AltaVista,Yahoo!和Googl ...
- python如何把数据写入excel表格中指定列
Python可以使用openpyxl库来将数据写入Excel表格中指定的列.如果要将数据写入指定的列中,可以使用如下代码:worksheet.write(row_index, column_index ...
- Python实现淘宝爬取——奶粉销售信息爬取及其数据可视化
简介 双十一刚过,TB的销售额又创下了新高,我也为2000+亿做出了贡献 恰巧买了一袋德运奶粉,味道还不错.我就在想,接触爬虫也有两个多月了,还没有爬过TB这种经典的网站,借着劲头就爬取了一下TB上奶 ...
- 淘宝爬取某人的所有购物订单
做风险控制和个人征信,需要做数据挖掘,第一步就是要爬到消费记录,当然还有很多其他项包括收货地址 宝贝收藏 快速退款额度 芝麻信用 绑定的手机等等,先要爬到数据才能分析. 淘宝直接请求登录接口不可行,不 ...
- python爬虫_爬取京东商品写入Excel表
新人的第二篇文章,写的不好请见谅 这段代码只是针对京东的商品信息爬取,很多都是根据页面源码去匹配获取数据的,别的网站用不了,也可能过一段时间官方修改了页面就不能用了,不过这里也只是提供学习使用,希望可 ...
- 用python爬取网站数据到excel
```python from bs4 import BeautifulSoup from urllib import request import xlwt#获取数据 value=1 while va ...
- 简单python爬取微博并写入excel
写了一个简单的Python爬取指定用户微博的内容和图片,目前比较简陋,之前有在github上参考别人写的爬虫,发现现在微博好像使用的是Ajax的方式来渲染数据,这也太方便了,直接请求接口,然后解析 ...
- python爬取天眼查存入excel表格_爬虫案例1——爬取新乡一中官网2018届高考录取名单...
有一种非常常见并且相对简单的网络爬虫,工作流程大概是这样的: 访问目标网页 提取目标网页内表格信息 写入excel文件并保存 初次实践,我决定尝试写一个这样的爬虫.经过一番构思,我准备把爬取新乡一中官 ...
- python爬取豆瓣TOP250生成Excel表格例子最新
一 确定爬取网站 因为初学,所以按照网上的教程爬取豆瓣TOP250的网站.网址: https://movie.douban.com/top250 二 编写爬虫程序 详细过程就不再一 一讲解,可以看代码 ...
最新文章
- 用SQL命令查看Mysql数据库大小
- 透過proxychains讓不支持代理的程序通過代理上網
- Linux上程序调试的基石(1)--ptrace
- 007_请求返回Json
- 使用expdp导出时评估所需存储容量大小
- 基于XGBoost的PU-Learning
- hashcode java_java 的Object类的hashcode()方法具体是怎么实现的?
- Cygwin 的代理设置(同 Linux)
- 基于51单片机的音乐播放器
- 安卓手机与电脑无线传输文件(利用ftp服务)
- python美多商城项目百度网盘_美多商城项目(十)
- html使用iframe src,HTML IFrame src用法及代码示例
- python中根据视频帧生成视频,保存为mp4格式
- win10系统资源管理器频繁崩溃重启的解决思路
- 韩钰带你走进电商世界之淘宝网店卖家快捷短语大全!
- cadence自动生成铺铜_Cadence Allegro简易手册连载7:内层及铺铜
- 智慧城市将开创城市新形态
- JavaWeb电商 秒杀业务分析
- QCC302X与AB1562A平台 txc_pa246光感驱动代码编写
- 我的Tensorflow学习之路
热门文章
- 新手如何做自媒体赚钱?天天看头条却不赚钱,这份资料对你有启发
- 同方微电子3S理念护航金融IC卡
- 什么是计算机网络 它有哪些主要功能,什么是计算机网络及主要功能有哪些?...
- Excel2010 柱形图与折线图制表
- 华为云发布桌面IDE-CodeArts
- 翻译翻译什么叫HTML5(六)“开门,js来查水表啦”
- 哪个快递能寄液晶显示器啊?
- Android应用客服系统解决方案---网易七鱼客服
- 基于AMSR-E和AMSR2数据的全球长时序日尺度土壤水分数据集(2002-2022)
- 对比灵敏度丨信噪比 - 开会用的全向麦克风应该怎么选?