主要使用的库:

requests:爬虫请求并获取源码
re:使用正则表达式提取数据
json:使用JSON提取数据
pandas:使用pandans存储数据
#!coding=utf-8
import requests
import os
import re
import json
import datetime
import time
import pandas as pd
from requests.packages.urllib3.exceptions import InsecureRequestWarning
requests.packages.urllib3.disable_warnings(InsecureRequestWarning)
import win32api,win32condef raw(text):  # 转化URL字符串escape_dict = {'/': '%252F','?': '%253F','=': '%253D',':': '%253A','&': '%26',}new_string = ''for char in text:try:new_string += escape_dict[char]except KeyError:new_string += charreturn new_stringdef mmm(item):item=raw(item)url='https://apapia.manmanbuy.com/ChromeWidgetServices/WidgetServices.ashx's=requests.session()headers={'Host':'apapia.manmanbuy.com','Content-Type':'application/x-www-form-urlencoded; charset=utf-8','Proxy-Connection':'close','Cookie':'ASP.NET_SessionId=uwhkmhd023ce0yx22jag2e0o; jjkcpnew111=cp46144734_1171363291_2017/11/25','User-Agent':'Mozilla/5.0 (iPhone; CPU iPhone OS 10_3_3 like Mac OS X) AppleWebKit/603.3.8 (KHTML, like Gecko) Mobile/14G60 mmbWebBrowse','Content-Length':'457','Accept-Encoding':'gzip','Connection':'close',}postdata='c_devid=2C5039AF-99D0-4800-BC36-DEB3654D202C&username=&qs=true&c_engver=1.2.35&c_devtoken=&c_devmodel=iPhone%20SE&c_contype=wifi&' \'t=1537348981671&c_win=w_320_h_568&p_url={}&' \'c_ostype=ios&jsoncallback=%3F&c_ctrl=w_search_trend0_f_content&methodName=getBiJiaInfo_wxsmall&c_devtype=phone&' \'jgzspic=no&c_operator=%E4%B8%AD%E5%9B%BD%E7%A7%BB%E5%8A%A8&c_appver=2.9.0&bj=false&c_dp=2&c_osver=10.3.3'.format(item)s.headers.update(headers)req=s.get(url=url,data=postdata,verify=False).text#print(req)try:js=json.loads(req)title = js['single']['title']  ##名称except Exception as e:print(e)#exit(mmm(item))
###数据清洗pic=js['single']['smallpic']  ##图片jiagequshi=js['single']['jiagequshi']  ##价格趋势lowerPrice=js['single']['lowerPrice']  ##最低价格lowerDate=js['single']['lowerDate']  ##最低价格日期lowerDate=re.search('[1-9]\d{0,9}',lowerDate).group(0)#print(lowerDate)lowerDate=time.strftime("%Y-%m-%d", time.localtime(int(lowerDate)))itemurl=js['single']['url']  ##商品链接qushi=js['single']['qushi']  ##趋势changPriceRemark=js['single']['changPriceRemark']   ##趋势变动date_list=[]   ##日期price_list=[]  ##价格##日期转换   datalist=jiagequshi.replace('[Date.UTC(','').replace(')','').replace(']','').split(',')for i in range(0,len(datalist),4):if i !=0:day = int(datalist[i + 2])if int(datalist[i + 1]) == 12:mon = 1year = int(datalist[i]) + 1else:mon = int(datalist[i + 1]) + 1year = int(datalist[i])date = datetime.date(year=year, month=mon, day=day)date = date - datetime.timedelta(days=1)price = float(datalist[i -1])date_list.append(date)price_list.append(price)day=int(datalist[i + 2])if int(datalist[i+1])==12:mon=1year=int(datalist[i])+1else:mon=int(datalist[i+1])+1year = int(datalist[i])date=datetime.date(year=year,month=mon,day=day)price=float(datalist[i+3])date_list.append(date)price_list.append(price)data={'date_日期':date_list,'price_价格':price_list}df = pd.DataFrame(data)df.loc[:, "title_名称"] = titledf.loc[:, "pic_图片"] = picdf.loc[:, "lowerPrice_最低价格"] = lowerPricedf.loc[:, "lowerDate_最低价格日期"] = lowerDatedf.loc[:, "itemurl_商品链接"] = itemurldf.loc[:, "qushi_趋势"] = qushidf.loc[:, "changPriceRemark_趋势变动"] = changPriceRemarkdf.to_csv('out.csv',index=False,mode='a',encoding="GB18030")  ##保存数据# print(df)#return dfif __name__ == '__main__':item='https://detail.tmall.com/item.htm?id=538801983798'   ##京东、淘宝、天猫等电商平台数据都可以获取mmm(item)

pyhton爬虫 爬取电商平台商品历史价格、最低价格(慢慢买网)相关推荐

  1. Python爬虫实战:selenium爬取电商平台商品数据

    前言 本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理. 作者: 极客挖掘机 PS:如有需要Python学习资料的小伙伴可以加点击下 ...

  2. 爬取电商平台数据,python爬取某维商品数据

    本次内容: 爬取电商平台数据,python爬取某维商品数据 课程亮点 动态数据抓包演示 json数据解析 requests模块的使用 保存csv 环境介绍 python 3.8 [最好用和老师一样的版 ...

  3. 【爬虫】Python爬取电商平台评论完整代码

    利用Ajax爬取淘宝评论,这里完整的补充一下,包括数据存储. 对于Ajax参数的分析,Python爬取平台评论,这篇文章分析过了这里不再重复了. 主要是完善一下代码. import time impo ...

  4. Python爬取电商平台充气娃娃用户评价,看看用户体验是什么样的!

    前言 本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,如有问题请及时联系我们以作处理. PS:如有需要Python学习资料的小伙伴可以加点击下方链接自行获取 python免费学习资 ...

  5. python爬取电商订单_Python探索之爬取电商售卖信息代码示例

    网络爬虫(又被称为网页蜘蛛,网络机器人,在FOAF社区中间,更经常的称为网页追逐者),是一种按照一定的规则,自动的抓取万维网信息的程序或者脚本. 下面有一个示例代码,分享给大家: #! /usr/bi ...

  6. 四川一度智信:电商平台商品关键词优化技巧

    四川一度智信:电商平台商品关键词优化技巧 有关一定网店运营经验的朋友,应该都知道标题对于商品发展来说的重要性.商品标题直接影响了商品的搜索展现情况,进而也就影响了商品的流量获取.因此,标题优化也是卖家 ...

  7. java电商商品基本信息表,Java生鲜电商平台-商品表的设计

    Java生鲜电商平台-商品表的设计 任何一个电商,无论是B2C还是B2B的电商,商品表的设计关系到整个系统架构的核心. 1. 商品基本信息表:用单词:goods做为商品表 2. 商品分类信息表: 说明 ...

  8. 网络爬虫爬取淘宝页面商品信息

    网络爬虫爬取淘宝页面商品信息 最近在MOOC上看嵩老师的网络爬虫课程,按照老师的写法并不能进行爬取,遇到了一个问题,就是关于如何"绕开"淘宝登录界面,正确的爬取相关信息.通过百度找 ...

  9. java产品分类和管理_Java生鲜电商平台-商品无限极目录的设计与架构

    Java生鲜电商平台-商品无限极目录的设计与架构 说明:任何一个商品都应该是先属于某一个目录,然后在目录中添加商品,目录理论上最多支持三级,因为级别太多,不容易管理.但是设计中需要设计无限制的级别. ...

最新文章

  1. 献给那些怀揣IT梦想的北漂一族
  2. 代码的演化-DI(理解依赖注入di,控制反转ioc)
  3. 454. 4Sum II ——查找本质:hash最快,二分次之
  4. 编译detours注意
  5. 毕业后的五年拉开大家差距的原因在哪里?
  6. 网页 php pdf文件怎么打开是乱码,打开php文件乱码的解决方法
  7. linux command read the content,Linux while 和 read 的用法
  8. Chrome浏览器嗅探功能技巧
  9. vue 二级三级路由配置
  10. 知道路径,如何下载服务器端的.frx文件
  11. oracle+suspend+参数,oracle数据库的挂起(Suspending)和恢复(Resuming)
  12. Android读出Excel报表数据然后导出写入到SQLite数据库
  13. 使用SSH方式实现Git远程连接GitHub
  14. 微信转账测试点梳理框架
  15. python中idx+=1_在Python中为apos;循环访问索引 Dovov编程网
  16. 利用 OpenWrt 共享局域网下的佳能 MG2580s/MX398打印扫描一体机
  17. PDF与word互相转换
  18. 增值税发票扫描识别|发票扫描识别|发票识别
  19. java计算机毕业设计扶贫平台源码+mysql数据库+系统+lw文档+部署
  20. 首推互联网银行平台 金融壹账通助力银行破解转型难题

热门文章

  1. 推荐个人网站使用的计数器
  2. Gradle学习第一篇——自定义Gradle插件
  3. 大数据AI智能—物联网世界对职业发展的影响
  4. 价格不断飙升的 GPU,居然「出生」这么晚!一文带你了解 GPU 的前生今世
  5. HFSS激励:Floquet端口激励(单元法)
  6. 特斯拉应用在自动驾驶汽车上的神经网络模型—Occupancy Networks
  7. mysql数据库表结构对比_mysqldiff工具对比mysql数据库表结构差异
  8. 设置备份计划后,不能执行自动备份
  9. HTML5新书三章大纲分享
  10. Catch That Cow题解BFS方法C++实现