#coding=GBK
import requests
import re
from xlwt import Workbook
import xlrd
import time

def key_name( number ):
    #获取页面的内容并返回
    name = '手机'

URL_1="https://s.taobao.com/search?ie=utf8&initiative_id=staobaoz_20170905&stats_click=search_radio_all%3A1&js=1&imgfile=&q="
    URL_2 = "&suggest=0_1&_input_charset=utf-8&wq=u&suggest_query=u&source=suggest&p4ppushleft=5%2C48&s="
    URL = ( URL_1 + name + URL_2 + str(number))
    #print(URL)
    res = requests.get( URL )
    return res.text

def find_date( text):
    #根据整个页面的信息,获取商品的数据所在的HTML源码并放回
    reg = r',"data":{"spus":\[({.+?)\]}},"header":'
    reg = re.compile(reg)
    info = re.findall(reg, text)
    return info[0]

def manipulation_data( info, N, sheet ):
    #解析获取的HTML源码,获取数据
    Date = eval(info)

for d in Date:
        T = " ".join([t['tag'] for t in d['tag_info']])
        #print(d['title'] + '\t' + d['price'] + '\t' + d['importantKey'][0:len(d['importantKey'])-1] + '\t' + T)
        
        sheet.write(N,0,d['title'])
        sheet.write(N,1,d['price'])
        sheet.write(N,2,T)
        N = N + 1
    return N
    
    
def main():
    
    book = Workbook()
    sheet = book.add_sheet('淘宝手机数据')
    sheet.write(0,0,'品牌')
    sheet.write(0,1,'价格')
    sheet.write(0,2,'配置')
    book.save('淘宝手机数据.xls')
    #k用于生成链接,每个链接的最后面的数字相差48.
    #N用于记录表格的数据行数,便于写入数据
    k = 0
    N = 1
    for i in range(10+1):
        text = key_name( k + i * 48 )
        info = find_date(text)
        N = manipulation_data( info ,N, sheet )
    
        book.save('淘宝手机数据.xls')
        print('下载第' + str(i) + '页完成')

if __name__ == '__main__':
    main()

python爬取淘宝手机信息并下载到excel文件中相关推荐

  1. Python爬取淘宝商品信息保存到Excel

    前言 本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,如有问题请及时联系我们以作处理. PS:如有需要Python学习资料的小伙伴可以加点击下方链接自行获取 python免费学习资 ...

  2. 使用python爬取淘宝商品信息

    使用python爬虫爬取淘宝商品信息 使用的模块主要有 selenium ,time , re, from selenium import webdriver import time import c ...

  3. python爬取淘宝商品信息_python爬取淘宝商品信息并加入购物车

    先说一下最终要达到的效果:谷歌浏览器登陆淘宝后,运行python项目,将任意任意淘宝商品的链接传入,并手动选择商品属性,输出其价格与剩余库存,然后选择购买数,自动加入购物车. 在开始爬取淘宝链接之前, ...

  4. python爬取淘宝商品信息并加入购物车

    先说一下最终要达到的效果:谷歌浏览器登陆淘宝后,运行python项目,将任意任意淘宝商品的链接传入,并手动选择商品属性,输出其价格与剩余库存,然后选择购买数,自动加入购物车. 在开始爬取淘宝链接之前, ...

  5. Python 爬取淘宝商品信息栏目

    一.相关知识点 1.1.Selenium Selenium是一个强大的开源Web功能测试工具系列,可进行读入测试套件.执行测试和记录测试结果,模拟真实用户操作,包括浏览页面.点击链接.输入文字.提交表 ...

  6. Python搜索爬取淘宝商品信息并存储为csv文件(名称、店铺、销量、地址等)

    功能是搜索商品,并把搜到的商品信息一一爬取(多个页面): 爬取商品名称.店铺名称.销量.评论数量.地址等等,然后把信息存储为csv文件- 效果: 首先是程序运行 运行完后可以看到目录下出现了一个csv ...

  7. python 提取网页正文_一篇文章教会你用Python爬取淘宝海量信息,把淘宝商品整理成一个表格...

    最近看了爬虫又新做了个小作品,来瞅瞅吧~~~ 正文开始 因为最近想买ipad,所以想要尝试一下吧 淘宝 上所有ipad商品做一个统计,把所有ipad商品的信息集合到一个excel里,那么使用爬虫这个程 ...

  8. python 爬取淘宝模特信息

    通过本篇博文,介绍一下我对指定信息进行爬取的时候的思路,顺便贴一下代码. 一.首先获取想要爬取的网站的url链接的规则变化 可以看出来该网站页面的url结构简单,变化的只是https://mm.tao ...

  9. Python爬取淘宝女模特信息

    前言 Python爬取淘宝美女信息下载本地并同时存储mysql数据库,存储数据库用到了pymysql模块,sql语句简单好用,直接上代码,源码请点链接Python-Spiders文集. 项目结构: 本 ...

最新文章

  1. 梯度下降法的三种形式-BGD、SGD、MBGD
  2. (笔试题)和0交换的排序
  3. vue自定义全局组件(或自定义插件)
  4. 两个链表是否相交 + 赛马(分桶)
  5. ospf-3型和5型汇总
  6. 解决mysql编码问题_解决mysql乱码问题
  7. Edge(chrome内核)浏览器Linux版本初体验
  8. 司空见惯 - 英雄扫雷鼠
  9. java实现图片去掉水印
  10. 如何解决Windows10系统空闲时间CPU占用高,风扇很响的问题?
  11. 利用ECharts可视化mysql数据库中的数据
  12. python共享文件协同编辑_那些可多人协作编辑的在线文档工具
  13. C语言 十六进制与ascii码互转
  14. 一次短暂的淮安、盐城之旅
  15. 牛客练习赛 43 F Tachibana Kanade Loves Game 容斥原理(Java版ac)
  16. Springboot毕设项目清心药房药品管理系统19e47java+VUE+Mybatis+Maven+Mysql+sprnig)
  17. k2698场效应管参数电流_常用场效应管参数大全,电压,参数表图文等,涨知识必读!...
  18. 黑莓9000支持Java吗_黑莓革命 BlackBerry 9000功能深度评测
  19. 【水滴石穿】FirstReactNativeProject
  20. 无法验证证书 java_求助大神“无法验证证书 将不执行该应用程序”我该怎么办?...

热门文章

  1. 上海亚商投顾:沪指尾盘拉升涨近1% 周期股掀涨停潮
  2. 顺序查找法和二分查找法
  3. 2021-08-11vue 基础知识 (three)
  4. JAVA ( EasyExcel 通过模板 导入、导出、下载模板)——亲测有用
  5. win7视力保护色设置
  6. eNSP—配置交换机端口安全
  7. 项目管理 | 项目成本估算都有哪些方法?
  8. 机械电子工程中的计算机思维,人工智能技术在机械电子工程领域的应用
  9. 码农提高工作效率很难?神级程序员五分钟带你提高!就这么简单!
  10. void main 和 int main的区别