我们上一篇文章已经获取到淘宝的数据写入了.json文件。现在我们就可以写入Excel表格。

运行结果是这样子的。

from selenium.webdriver import Chrome
import time
from lxml import etree
import json
import xlwt
#导包
if __name__ == '__main__':chrome_obj = Chrome()#因为是个类,所以要创建一个对象。chrome_obj.get('https://uland.taobao.com/sem/tbsearch?refpid=mm_26632258_3504122_32538762&keyword=%E5%A5%B3%E8%A3%85&clk1=ab1fdcf6365ee8bc6248263f22f49a33&upsId=ab1fdcf6365ee8bc6248263f22f49a33')  # 往浏览器的网页地址栏填入淘宝网址#先定位到搜索框input_obj = chrome_obj.find_element_by_xpath('//*[@id="J_search_key"]').clear()# 输入搜索框数据input_obj = chrome_obj.find_element_by_xpath('//*[@id="J_search_key"]').send_keys('男装')#定位到点击搜索按钮click_obj = chrome_obj.find_element_by_xpath('//*[@id="J_searchForm"]/input')# 触发点击click_obj.click()# 页面等待,等待数据加载完毕time.sleep(2)# 获取源码数据html_data = chrome_obj.page_source# 数据的提取:html_obj = etree.HTML(html_data)# 商品名name_list = html_obj.xpath('//div/span[@class="title-text"]/text()')print(name_list)#商品销量sell_info = html_obj.xpath('//div/div[@class="sell-info"]/text()')print(sell_info)#商品价格//div/span[@class="coupon-price-afterCoupon"]/text()jiage = html_obj.xpath('//div/span[@class="coupon-price-afterCoupon"]/text()')print(jiage)book = xlwt.Workbook(encoding='utf-8', style_compression=0)#表格明如sheetsheet = book.add_sheet('淘宝', cell_overwrite_ok=True)#写出第一行的列col = ('商品名称', '价格', '销量')for i in range(0, 3):sheet.write(0, i, col[i])#将数据合并为一个列表,一个列表里面嵌套多个列表,我们不需要知道有多少,直接len(name_list)就可以知道有多少个dict_ = []for i in range(len(name_list)):dict_1 = [name_list[i], sell_info[i], jiage[i]]print(dict_1)dict_.append(dict_1)print(dict_)
#将数据以一个列表写入Excel表格for i in range(0, 60):data = dict_[i]for j in range(0, 3):sheet.write(i + 1, j, data[j])#这一步我们要在D:/python项目/ 这个目录下先新建一个叫taobao.xls的文件,不然会报错savepath = 'D:/python项目/taobao.xls'book.save(savepath)#打开文件后要关闭才能运行,不然会报权限不够的错误。#关闭浏览器chrome_obj.quit()

将淘宝爬取的数据写入Excel表格相关推荐

  1. Python爬虫项目:爬取JSON数据存储Excel表格与存储图片

    随着网络的迅速发展,万维网成为大量信息的载体,如何有效地提取并利用这些信息成为一个巨大的挑战.搜索引擎(Search Engine),例如传统的通用搜索引擎AltaVista,Yahoo!和Googl ...

  2. python如何把数据写入excel表格中指定列

    Python可以使用openpyxl库来将数据写入Excel表格中指定的列.如果要将数据写入指定的列中,可以使用如下代码:worksheet.write(row_index, column_index ...

  3. Python实现淘宝爬取——奶粉销售信息爬取及其数据可视化

    简介 双十一刚过,TB的销售额又创下了新高,我也为2000+亿做出了贡献 恰巧买了一袋德运奶粉,味道还不错.我就在想,接触爬虫也有两个多月了,还没有爬过TB这种经典的网站,借着劲头就爬取了一下TB上奶 ...

  4. 淘宝爬取某人的所有购物订单

    做风险控制和个人征信,需要做数据挖掘,第一步就是要爬到消费记录,当然还有很多其他项包括收货地址 宝贝收藏 快速退款额度 芝麻信用 绑定的手机等等,先要爬到数据才能分析. 淘宝直接请求登录接口不可行,不 ...

  5. python爬虫_爬取京东商品写入Excel表

    新人的第二篇文章,写的不好请见谅 这段代码只是针对京东的商品信息爬取,很多都是根据页面源码去匹配获取数据的,别的网站用不了,也可能过一段时间官方修改了页面就不能用了,不过这里也只是提供学习使用,希望可 ...

  6. 用python爬取网站数据到excel

    ```python from bs4 import BeautifulSoup from urllib import request import xlwt#获取数据 value=1 while va ...

  7. 简单python爬取微博并写入excel

    ​ 写了一个简单的Python爬取指定用户微博的内容和图片,目前比较简陋,之前有在github上参考别人写的爬虫,发现现在微博好像使用的是Ajax的方式来渲染数据,这也太方便了,直接请求接口,然后解析 ...

  8. python爬取天眼查存入excel表格_爬虫案例1——爬取新乡一中官网2018届高考录取名单...

    有一种非常常见并且相对简单的网络爬虫,工作流程大概是这样的: 访问目标网页 提取目标网页内表格信息 写入excel文件并保存 初次实践,我决定尝试写一个这样的爬虫.经过一番构思,我准备把爬取新乡一中官 ...

  9. python爬取豆瓣TOP250生成Excel表格例子最新

    一 确定爬取网站 因为初学,所以按照网上的教程爬取豆瓣TOP250的网站.网址: https://movie.douban.com/top250 二 编写爬虫程序 详细过程就不再一 一讲解,可以看代码 ...

最新文章

  1. 用SQL命令查看Mysql数据库大小
  2. 透過proxychains讓不支持代理的程序通過代理上網
  3. Linux上程序调试的基石(1)--ptrace
  4. 007_请求返回Json
  5. 使用expdp导出时评估所需存储容量大小
  6. 基于XGBoost的PU-Learning
  7. hashcode java_java 的Object类的hashcode()方法具体是怎么实现的?
  8. Cygwin 的代理设置(同 Linux)
  9. 基于51单片机的音乐播放器
  10. 安卓手机与电脑无线传输文件(利用ftp服务)
  11. python美多商城项目百度网盘_美多商城项目(十)
  12. html使用iframe src,HTML IFrame src用法及代码示例
  13. python中根据视频帧生成视频,保存为mp4格式
  14. win10系统资源管理器频繁崩溃重启的解决思路
  15. 韩钰带你走进电商世界之淘宝网店卖家快捷短语大全!
  16. cadence自动生成铺铜_Cadence Allegro简易手册连载7:内层及铺铜
  17. 智慧城市将开创城市新形态
  18. JavaWeb电商 秒杀业务分析
  19. QCC302X与AB1562A平台 txc_pa246光感驱动代码编写
  20. 我的Tensorflow学习之路

热门文章

  1. 新手如何做自媒体赚钱?天天看头条却不赚钱,这份资料对你有启发
  2. 同方微电子3S理念护航金融IC卡
  3. 什么是计算机网络 它有哪些主要功能,什么是计算机网络及主要功能有哪些?...
  4. Excel2010 柱形图与折线图制表
  5. 华为云发布桌面IDE-CodeArts
  6. 翻译翻译什么叫HTML5(六)“开门,js来查水表啦”
  7. 哪个快递能寄液晶显示器啊?
  8. Android应用客服系统解决方案---网易七鱼客服
  9. 基于AMSR-E和AMSR2数据的全球长时序日尺度土壤水分数据集(2002-2022)
  10. 对比灵敏度丨信噪比 - 开会用的全向麦克风应该怎么选?