我学爬虫是始于装叉,但是装叉动力不够,老师大作业要我们学,无奈,这里试着用python爬取steam动态网页的数据,挺简单的

# -*- coding: utf-8 -*-
# @Author:胡澳治
import requests
from lxml import etreedef trans(data_list, type):if len(data_list) == 0:return "空"elif type == "price":for data in data_list:if data.find("¥") != -1:return data.strip()if len(data_list) == 2:return data_list[1].strip()else:return data_list[0].strip()elif type == "time":return data_list[0].replace(","," ")elif type == "review":return data_list[0].replace(",","")else:return data_list[0]headers = {'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/89.0.4389.72 Safari/537.36 Edg/89.0.774.45'
}with open("steamData.txt","w",encoding="utf-8") as fp:fp.write("游戏名称,游戏价格,游戏网址,游戏图像地址,游戏发布时间,游戏评价,")for page in range(160):post_url = format("https://store.steampowered.com/search/results/?query&start=%d&count=50&dynamic_data=&sort_by=_ASC&os=win&snr=1_7_7_7000_7&filter=topsellers&infinite=1"%(page*50))print(post_url)page_text = requests.get(url=post_url, headers=headers).json()page_text = page_text["results_html"]tree = etree.HTML(page_text)# print(page_text)all_games_list = tree.xpath('//a')fp.write('\n')for game in all_games_list:game_url = game.xpath('./@href')game_url = trans(game_url,"")game_img_src = game.xpath('.//img/@src')game_img_src = trans(game_img_src,"")game_title = game.xpath('.//span[@class="title"]/text()')game_title = trans(game_title,"")game_time = game.xpath('./div[2]/div[2]/text()')game_time = trans(game_time,"time")game_review = game.xpath('./div[2]/div[3]/span/@data-tooltip-html')game_review = trans(game_review,"review")game_price = game.xpath('./div[2]/div[4]/div[2]/text()')game_price = trans(game_price,"price")fp.write(game_title+",")fp.write(game_price+",")fp.write(game_url+",")fp.write(game_img_src+",")fp.write(game_time+",")fp.write(game_review+",")# print(game_review)fp.write('\n')print(page+1,"/160")

后期这里爬出来是txt文件,以逗号分隔,改拓展名为.csv,编码格式改为ANSI即可在excel表格中显示并且不会乱码

爬取steam上热门游戏的价格,网址,评价数据相关推荐

  1. steam夏日促销用Python爬取排行榜上的游戏打折信息

    不知不觉,一年一度如火如荼的 steam 夏日促销悄然开始了.每年通过大大小小的促销,我的游戏库里已经堆积满还未下载过的游戏.但所谓"买到就是赚到,G胖一定大亏"的想法日渐流行,指 ...

  2. steam夏日促销悄然开始,用Python爬取排行榜上的游戏打折信息

    前言 很多人学习python,不知道从何学起. 很多人学习python,掌握了基本语法过后,不知道在哪里寻找案例上手. 很多已经做案例的人,却不知道如何去学习更加高深的知识. 那么针对这三类人,我给大 ...

  3. steam夏日促销悄然开始,用Python爬取排行榜上的游戏打折信息!

    前言 本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理. 不知不觉,一年一度如火如荼的steam夏日促销悄然开始了.每年通过大大小小 ...

  4. 爬取github上热门项目并绘制图表

    github上的项目都存储在仓库中,本篇文章编写了一个程序可自动获取这些项目的具体信息,并将信息可视化展示出来. 1.使用API调用请求数据并处理API响应 直接在浏览器中输入https://api. ...

  5. 用python爬取3dm上的单机游戏评测信息

    用python爬取3dm上的单机游戏评测信息 参考结果 #爬取3dm上单机游戏评测榜,50页的相关信息import requests from lxml import etree headers={& ...

  6. python爬取电影评分_用Python爬取猫眼上的top100评分电影

    代码如下: # 注意encoding = 'utf-8'和ensure_ascii = False,不写的话不能输出汉字 import requests from requests.exception ...

  7. 英文名看不懂?爬取steam游戏中文优惠信息

    需求分析 昨天,我发布了爬取steam游戏优惠信息的程序,可是呢,很快啊,有一个年轻人找到我说,"仙老师,你这个程序我用了,有问题!" 我立刻问到,"发生甚么事了,我说这 ...

  8. 茅台酒如何转卖?价格如何才最合理?爬取公众号后每天自动发送价格到钉钉如何呢?

    最近i茅台非常火,同时火起来的还有茅台价格-于是想了一个思路 写了部分内容,希望能够有所帮助 具体步骤: 打开公众号,下载图片,图片识别,确认自己想要的内容–发送钉钉. 下面为爬取公众号代码模块 # ...

  9. java爬虫京东商品,Java爬虫实现爬取京东上的手机搜索页面 HttpCliient+Jsoup

    1.需求及配置 需求:爬取京东手机搜索页面的信息,记录各手机的名称,价格,评论数等,形成一个可用于实际分析的数据表格. 使用maven项目,log4j记录日志,日志仅导出到控制台. maven依赖如下 ...

最新文章

  1. C/Cpp / static 关键字
  2. Python 网站应用从开发到部署
  3. 在Fedora 11中安装Apache2+PHP5+MySQL(LAMP)
  4. 找规律 SGU 107 987654321 problem
  5. python判断是否有重复单词_Python:在字符串列表中查找未知的重复单词
  6. 科海思除镍树脂CH-90Na
  7. opencv GPU加速 多GPU卡指定GPU索引方法
  8. SpaceX星链技术取代不了5G,但会让打仗变成打游戏
  9. javacpp-opencv图像处理系列:国内车辆牌照检测识别系统(万份测试准确率79.7%以上)
  10. excel最大行数各版本介绍
  11. python爬虫请求头是什么意思_Pytho爬虫中Requests设置请求头Headers的方法
  12. 那些值得一读再读的好书
  13. 水平面上两直线垂直,且斜率都存在,分别为k1,k2,则k1·k2=-1
  14. 约瑟夫问题和又遇约瑟夫问题
  15. 2018焦作ICPC E. Resistors in Parallel(打表+大数)
  16. VB虚拟机中ubuntu Linux系统安装使用MCNP5
  17. ppt如何转换pdf
  18. 真正好用的数据恢复软件EasyRecovery15
  19. iOS Masonry
  20. 25PGN图片的超级玩法

热门文章

  1. python3(五)无监督学习
  2. 基于jsp设计的童装商城系统
  3. maka做出好设计_MAKA:进军海报创作市场,PS小白也能做出高逼格海报
  4. 2008中国手机客户端软件Top50评选结果
  5. 打印机服务器 win7系统,Win7系统针式打印机设置的方法
  6. 现代经典搞笑300篇笑话
  7. wamp下配置php文件,wamp开发环境快速搭建详细步骤
  8. 日本最大菜谱网站Cookpad微服务经验总结
  9. 神武3手游一直等待服务器响应,神武3手游怎么进不去
  10. 基于Spring Boot+Vue的宠物服务管理系统-计算机毕业设计