import requests
from bs4 import BeautifulSoup

def main(n):
for i in range(n):
url = f’http://www.doutula.com/photo/list/?page={i}’
response = requests.get(url=url)

    soup = BeautifulSoup(response.text, 'html.parser')div = soup.find(name='div', attrs={"class": 'page-content text-center'})a_list = div.find_all(name="a")for a in a_list:img = a.find('img')img_name = img.get('alt')img_url = img.get('data-backup')# print(img_name, img_url)if img_name and img_url:try:with open('表情包/%s.jpg' % img_name, 'wb')as f:ret_img = requests.get(url=img_url)f.write(ret_img.content)except Exception:continue

main(5)

爬取http://www.doutula.com网站表情包相关推荐

  1. Python爬虫实例:爬取微信公众号图片(表情包)

    背景: 在学习了简单爬虫的编写之后,我试图通过编写爬取公众号图片(表情包)来丰富我的聊天技能,亦不致于败给各种熊猫头. 在学习了requests库之后,就能够很轻松地爬取静态页面的信息,把网页对象获取 ...

  2. 《python爬虫练习2》爬取网站表情包

    获取网站表情包 运行环境: #环境:win10 import requests #发送请求 from lxml import etree #获取html主页树状代码 import os #创建本地文件 ...

  3. python爬虫实战二:爬取网站表情包

    还在担心找不到适合的表情包怼人吗?还在为自己找不到搞笑的表情包而烦恼吗?教你用python快速爬取网站表情包! 网站链接: https://fabiaoqing.com/biaoqing/lists/ ...

  4. 深夜,我用python爬取了整个斗图网站,不服来斗

    深夜,我用python爬取了整个斗图网站,不服来斗 QQ.微信斗图总是斗不过,索性直接来爬斗图网,我有整个网站的图,不服来斗. 废话不多说,选取的网站为斗图啦,我们先简单来看一下网站的结构 网页信息 ...

  5. 如何利用 C# 爬取带 Token 验证的网站数据?

    在对文本数据的情感分析中,基于情感词典的方法是最简单也是最常用的一种了. 它的大体思路如下: 对文档分词,找出文档中的情感词.否定词以及程度副词,然后判断每个情感词之前是否有否定词及程度副词,将它之前 ...

  6. 第一个爬虫项目-爬取唯美小姐姐网站

    爬取唯美小姐姐网站 链接: 源代码文件下载地址 展示 源代码 import requests import re import os import time# 伪装 用于可以伪装成浏览器. heade ...

  7. 爬取笔趣阁小说网站上的所有小说(二)

    爬取笔趣阁小说网站上的所有小说(二) 网址为:https://www.biqukan.cc/topallvisit/1.html 我们已经拿到了所有小说的地址爬取笔趣阁小说网站上的所有小说(一),现在 ...

  8. python爬取网站的某一句话_Python实现JS解密并爬取某音漫客网站

    首先打开网站 https://www.zymk.cn/1/37988.html 打开开发者工具 选择XHR标签页,没有找到什么 再查看一下这些图片的URL值 http://mhpic.xiaoming ...

  9. python爬取哔哩哔哩网站数据以及弹幕

    首先要爬取哔哩哔哩网站的数据 , 第一步就是要分析网页,找到网上ajax异步加载的数据 即json文件,找到后还要对其爬去,这里我选正则表达式爬去网页,其次是 对爬取的数据进行清洗,防止脏数据对生成的 ...

最新文章

  1. linux6用户t密码,linux系统 用户和组管理类命令的使用方法
  2. 科大星云诗社动态20201203
  3. c/c++ 两种文件流用法
  4. C++11的for循环使用auto的新用法
  5. LeetCode-Spiral Matrix-螺旋矩阵
  6. 一个类中有一个参数,需要在另一个类中用到
  7. linux常用命令整理1
  8. [转载] Python——摄氏温度转换华氏温度
  9. sql server系统表详细说明(2)
  10. 易宝典文章——玩转Office 365中的Exchange Online服务 之十一 怎样在Exchange Online中配置邮件传递限制...
  11. 修改select下拉框样式兼容IE和Chrome浏览器
  12. 卡尔曼滤波器之扩展卡尔曼滤波
  13. 以聚合数据为例,详细说明API接口使用方法
  14. Dedecms错误警告:连接数据库失败,可能数据库密码不对或数据库服务器出错怎么解决?
  15. 旗下企业永远不会超过七家 马云
  16. 初学51单片机制作智能小车心得
  17. selenium+python爬取简书文章
  18. 基于VANET车辆组网通信系统的matlab仿真
  19. 【H.264/AVC视频编解码技术详解】十七:帧内预测编码的预测实现方法
  20. “小白兔”微信公众号菜单图形管理工具

热门文章

  1. 西门子1200博途程序与威纶触摸屏画面实例 西门子1200与4台MS300变频器modbus485轮询读写参数
  2. 如今的互联网还是不是最值得加入的行业 #从熊猫败局聊起(转载)
  3. teamviewer Linux centos7安装使用详细
  4. Myeclipse WebServer 之 简单局域网服务器使用(简单实现局域网IP:Port端口访问局域网数据)
  5. 十个非常好用的文件上传工具(插件)
  6. Bootstrap Table使用整理(一)
  7. Android UI开发——Material Design界面设计风格
  8. 【情人节快乐】“我还是很喜欢你就像sin²a+cos²a 始终如一”(附表白代码)
  9. GPS导航电文——第一子帧数据解析
  10. ZCMU--1925: hx xh‘s game(C语言)