提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档

文章目录

  • 前言
  • 一、数据爬取
  • 二、使用步骤
    • 1.引入库
    • 2.读入数据
  • 总结

前言

爬虫系列。


提示:以下是本篇文章正文内容,下面案例可供参考

一、数据爬取

示例:

二、使用步骤

1.引入库

代码如下(示例):

import requests
from lxml import etree
from selenium import webdriver
import os
from selenium.webdriver.chrome.options import Options
import csv
import pymysql

2.读入数据

代码如下(示例):


def get_url():base_url = 'http://pvp.qq.com/web201605/herolist.shtml'headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.122 Safari/537.36','Cookie':'RK=swQA3R4MTO; ptcz=fbbbfb166ef6016e5ef8db808b8e3fc849a10172cbfbf171112f9bf6246b8f1f; pgv_pvi=1645316096; pgv_pvid=3000228160; tvfe_boss_uuid=076500798fce0fbe; LW_uid=H1Q506i6v039A431t746D0l7m1; eas_sid=G1q5z6m6n059z4Z1q7J6H0a7t9; LW_sid=K1k5J6R888L9k9w3z0M5J1G2n6; ied_qq=o1248452992; o_cookie=1248452992; pac_uid=1_1248452992; uin_cookie=o1248452992; isHostDate=18389; isOsSysDate=18389; isOsDate=18389; PTTuserFirstTime=1588809600000; PTTosSysFirstTime=1588809600000; PTTosFirstTime=1588809600000; pgv_info=ssid=s9336335392; ts_uid=3000228160; weekloop=0-0-0-19; ieg_ingame_userid=i9k868I8dfvOg6iKeu5I8xnEmvJUtQBi; pt2gguin=o1248452992; ts_last=pvp.qq.com/web201605/herodetail/190.shtml; pvpqqcomrouteLine=herolist_herodetail_herodetail; PTTDate=1588834714567',}response = requests.get(url=base_url, headers = headers)response.encoding = 'gbk'html = response.textselector = etree.HTML(html)url_list = selector.xpath("//ul[@class='herolist clearfix']/li/a/@href")for url in url_list:url = 'http://pvp.qq.com/web201605/'+urlyield urldef get_name_and_url(url):options = Options()options.add_argument('--headless')options.add_argument('--disable-gpu')chrome = webdriver.Chrome(options=options)chrome.get(url)lis = chrome.find_elements_by_css_selector('.pic-pf-list li')for li in lis:img_url = 'http:'+li.find_element_by_tag_name("img").get_attribute("data-imgname")name = li.find_element_by_tag_name("p").textyield name, img_urldef save_to_local(name, img_url):img = requests.get(img_url).contentif os.path.exists('./wangzhe/') == False:os.makedirs('./wangzhe/')with open('./wangzhe/' + name + '.png', 'wb') as f:f.write(img)f.flush()print('success')f.close()def insertMysql(name, img_url):connect = pymysql.connect(host='localhost', user='root', password='123456', database='spiders', port=3306)cursor = connect.cursor()sql = 'insert into wangzhe(name, img_url) values(%s, %s)'cursor.execute(sql, (name, img_url))connect.commit()cursor.close()connect.close()def save_to_csv(name, img_url):with open('wangzhe.csv', 'a', encoding='utf-8', newline='') as f:writer = csv.writer(f)writer.writerow((name, img_url))print('success')for url in get_url():for name, img_url in get_name_and_url(url):save_to_local(name, img_url)

该处使用的url网络请求的数据。


总结

提示:这里对文章进行总结:
例如:以上就是今天要讲的内容,本文仅仅简单介绍了pandas的使用,而pandas提供了大量能使我们快速便捷地处理数据的函数和方法。

爬王者荣耀动漫人物图片--python为例相关推荐

  1. python绘制动漫人物图片女生可爱_绘画动漫人物图片女生唯美

    喜欢动漫的朋友,一定也想画出唯美好看的动漫人物图片.学习啦小编特意为大家提供了绘画动漫人物女生唯美图片,如果你喜欢的话,记得分享给更多好友哦! 绘画动漫人物女生唯美图片欣赏 绘画动漫人物女生唯美图片1 ...

  2. python绘制动漫人物图片女生可爱_日本动漫人物图片女生可爱图片大全

    日本动漫一直都是动漫行业的领军者,日本是一个全民都喜欢可爱事物的国家,因此日本动漫里的可爱女生自然不在少数,下面是学习啦小编整理的日本动漫人物图片女生可爱图片大全,欢迎欣赏. 日本动漫人物图片女生可爱 ...

  3. 给动漫人物图片去马赛克的工具!(python)开源

      查看  https://github.com/youyuge34/Anime-InPainting

  4. 基础 | 如何通过DCGAN实现动漫人物图像的自动生成?

    点击上方"机器学习与生成对抗网络",关注"星标" 获取有趣.好玩的前沿干货! 文章来源:淘系技术 背景 基于生成对抗网络(GAN)的动漫人物生成近年来兴起的动漫 ...

  5. vegas可以做动画吗_使用Vegas如何编辑动漫人物合辑?

    80.90乃至00后可以说是现在ACG文化的主流人群,有不少人曾经或者现在仍旧在追着动漫. A站与B站可以说是国内ACG文化的大本营,B站已不再局限于ACG小圈子的定位,番剧与动漫相关的视频仍旧是站内 ...

  6. Python爬取王者荣耀全英雄全皮肤图片

    Python爬取王者荣耀全英雄全皮肤图片 前言 思路 分析 编码 案例源码 附图 总结 前言 以前写过类似的博客,利用Java爬取王者荣耀全英雄全皮肤图片,当时是利用 jsoup包来对目标网页进行解析 ...

  7. jsoup爬取王者荣耀所有英雄背景图片

    jsoup爬取王者荣耀所有英雄背景图片 import org.jsoup.Jsoup; import org.jsoup.nodes.Document; import org.jsoup.nodes. ...

  8. 如何通过DCGAN实现动漫人物图像的自动生成?

    深度学习领域在近几年取得了重大突破,其中大部分研究成果都基于感知技术,计算机通过模仿人类的思维方式,感知物体.识别内容.生成对抗网络的理念由Goodfellow于2014年提出的,它的发展历程只有六年 ...

  9. python玩王者荣耀皮肤_《王者荣耀》游戏皮肤用python免费“偷”

    原标题:<王者荣耀>游戏皮肤用python免费"偷" 本文使用Python制作爬虫,来爬取<英雄联盟><王者荣耀><神之浩劫>等游戏 ...

最新文章

  1. CPM-2细节发布!10大技术打通大模型「任督二脉」,单卡单机跑「千亿模型」不再是梦...
  2. Postgres-XL:基于PostgreSQL的开源可扩展数据库集群
  3. MultiPoseNet:人体检测、姿态估计、语义分割一“网”打尽
  4. Redis集群管理(二)
  5. javaweb----三层架构
  6. 架构师之路17年精选80篇
  7. Google Colab——谷歌免费GPU使用教程
  8. LeetCode 1235. 规划兼职工作(动态规划+二分查找)
  9. [置顶]LGame框架问题汇总,有疑问请发至此文
  10. c#自定义事件的使用方法
  11. tesseract 使用说明
  12. 【Java】Java字符串拼接的五种方法,哪种性能最好?
  13. kindle5 去广告
  14. Soulver:不光会算,还懂你所言的计算器
  15. 向jre中添加安全证书
  16. python识图坐标_python 识别minecraft截图坐标
  17. 基于神经网络的车牌识别系统
  18. 托福百日冲刺—词汇(4)
  19. Ansys Lumerical | 铌酸锂热调制波导仿真
  20. 半年面试,我总结出了java面试笔记

热门文章

  1. PropertyDescriptor 详解
  2. Unity ShaderLab特效教程 适用于贴图、sprite和ugui的2d着色器实例 代码+详解注释 【2d流光边框效果】
  3. linux密码忘了?一招解决
  4. python爬取街拍美女图片
  5. 蓝牙音乐 A2DP 剖析
  6. java费布拉切数列前40个数_布拉切是哪人 cba布拉切工资多少
  7. 英特尔携手天融信打造融合桌面云,助力企业“上云用数赋智”之旅
  8. 计算机技能培训教研活动,2016年春计算机教研组工作安排
  9. 新天龙八部自动喊话重写版
  10. 九妹儿第一次在同事面前亮相