python—表情包爬取

闲着无聊时写了一个表情包爬取的简单脚本

运行效果如下

  • 输入要爬取的页数以及要保存的目录地址
  • 坐等表情包
  • 运行后效果如下

代码如下

import requests
from bs4 import BeautifulSoup
import os
global headers#请求头
headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.25 Safari/537.36 Core/1.70.3754.400 QQBrowser/10.5.4020.400'}#初始网页爬取
def get_page(url):item_list = []response = requests.get(url, headers=headers, timeout=(3, 3)).textsoup = BeautifulSoup(response, 'lxml')soup.prettify()data = soup.select('#home > div > div.col-sm-9.center-wrap > a')for item in data:item_list.append({'title' : item.select('.random_title')[0].get_text(), 'href' : item['href']})return item_list
#图片链接获取
def get_href(item_list,dizhi):for item in item_list:img_list=[]if not os.path.exists('{}/{}'.format(dizhi, item['title'])):os.mkdir('{}/{}'.format(dizhi,item['title']))address='{}/{}'.format(dizhi,item['title'])print(address)url=item['href']response=requests.get(url,headers=headers, timeout=(3, 3)).textsoup=BeautifulSoup(response,'lxml')soup.prettify()imgs=soup.select('body > div.container_ > div.container > div > div.col-sm-9.center-wrap > li > div.pic-content > div > table > tbody > tr:nth-child(1) > td > a > img')num = 1for img in imgs:if img['alt'] == '':img['alt'] = str(num)img_list.append({'name' : img['alt'], 'url' : img['src']})num+=1# print(img_list)#downloadfor img in img_list:try:down_img(img['url'], address, img['name'])except :continue
#图片下载
def down_img(url,address,name):img=requests.get(url, headers=headers, timeout=(3, 3)).contentdress=address+'/'+name+'.jpg'print('正在下载...')print(dress)if not os.path.exists(dress):with open(dress,'wb') as sub:sub.write(img)print('OK')
def main():page=int(input('请输入要下载的页数 :'))dizhi=input('请输入要下载的地址(C:/Users/KYA08/Desktop/表情包)可以桌面创建表情包文件夹,然后复制前面路径做简单修改:')for page in range(1,page):url='https://www.doutula.com/article/list/?page={}'.format(page)# items = get_page(url)# get_href(items, dizhi)try:items = get_page(url)get_href(items, dizhi)except Exception as e:continueif __name__ == '__main__':main()

可自行打包

方式如下

  1. 进入此py文件所在的文件夹
  2. 在文件路径框内输入 cmd,回车即可进入当下目录的命令行窗口


3.进入命令行窗口后输入以下命令:
pyinstaller -F demo.py
注: demo,py替换为py文件名
4. 即可在当前文件夹下生成dist文件夹,里面即为打包后的可执行文件

说明

  • 爬取网站为随机找的表情包网站,不含恶意
  • 整体代码不够完善,一些空外目录未处理,速度未做提升,主要为基本操作代码,大佬勿喷,本人小白

python---表情包爬取相关推荐

  1. python爬微信头像_使用python itchat包爬取微信好友头像形成矩形头像集的方法

    初学python,我们必须干点有意思的事!从微信下手吧! 头像集样例如下: 大家可以发朋友圈开启辨认大赛哈哈~ 话不多说,直接上代码,注释我写了比较多,大家应该能看懂 import itchat im ...

  2. python爬取微信好友头像_使用python itchat包爬取微信好友头像形成矩形头像集的方法...

    初学python,我们必须干点有意思的事!从微信下手吧! 头像集样例如下: 大家可以发朋友圈开启辨认大赛哈哈~ 话不多说,直接上代码,注释我写了比较多,大家应该能看懂 import itchat im ...

  3. python爬取微信朋友圈图片_使用python itchat包爬取微信好友头像形成矩形头像集的方法...

    初学python,我们必须干点有意思的事!从微信下手吧! 头像集样例如下: 大家可以发朋友圈开启辨认大赛哈哈~ 话不多说,直接上代码,注释我写了比较多,大家应该能看懂 import itchat im ...

  4. 一起学python表情包_真香警告!多线程分类表情包爬取,一起斗图叭(*^▽^*)~~~

    :点击上方[Python爬虫数据分析挖掘]→右上角[...]→[设为星标⭐] 多线程爬取表情包 有一个网站,叫做"斗图啦",网址是:https://www.doutula.com/ ...

  5. python 表情包制作工具_python中tkinter模块制作表情包爬取工具遇到的问题

    [Python] 纯文本查看 复制代码import tkinter as tk from tkinter.filedialog import askdirectory import requests ...

  6. 记一次简单的表情包爬取_python

    爬取的网页地址(逗比拯救世界): http://www.dbbqb.com copy代码之前应先安装requests库,这里不详细介绍(不装了,本人懒得写) 利用requests库进行操作: impo ...

  7. python爬虫===表情包爬取

    问题: 1.路径问题以及获取路径问题 **注:argv[0]只是得到的是当前脚本的绝对位置:而os模块中的几种获得路径的方法,得到的是当前的工作目录,如:open('1.txt','r'),则会在当前 ...

  8. 用python itchat包 爬取微信好友头像形成矩形头像集

    原创作品,转载请注明地址哈 ~ ###初学python,我们必须干点有意思的事!从微信下手吧! 头像集样例如下: 大家可以发朋友圈开启辨认大赛哈哈~ 话不多说,直接上代码,注释我写了比较多,大家应该能 ...

  9. 学习python表情包_我用Python一键保存了半佛老师所有的骚气表情包

    本文首发于公众号「Python知识圈」,如需转载,请在公众号联系作者授权. 2019年发现两个有意思而且内容比较硬核的公众号.都是同一个人运营的,我们都叫他半佛老师,现实中的职业是风控,公众号内容涉及 ...

最新文章

  1. 注释参数opengl的surfaceview使用findViewById返回null问题解决
  2. java Character类的一些简单的方法
  3. *** Procedure 存储过程 ***
  4. .QT-制作最强电压电阻表盘,可以自定义阴影效果,渐变颜色,图标,文字标签等-附带demo程序
  5. apache ignite_使用Apache Storm和Apache Ignite进行复杂事件处理(CEP)
  6. Apache Camel 2.18发布–包含内容
  7. 老板让我搞数字化转型?成功之后,我整理了这套超全的方法论
  8. 分子进化和系统发育的基础知识
  9. 敏捷开发系列之旅 第四站(透明的Crystal水晶方法) .
  10. arm汇编指令集_汇编入门第一篇,小白也能看懂
  11. 视频剪辑的方法,视频裂变
  12. 正态分布的前世今生(靳志辉“Ÿ)
  13. 哈夫曼编码器“数据结构课程设计”
  14. 关于计算机这一块儿的认识
  15. **视频会议设备连接注意事项**
  16. pycharm IDE中英文切换
  17. echarts 球形水波_ECharts 水球图教程
  18. 高德地图开发(一、引入地图)
  19. 前端三大构建工具 Webpack、Vite、Rollup 优劣势及原理分析
  20. Threes.js入门篇之8 - 材质与纹理

热门文章

  1. 三星android5.0基带,Galaxy S10 5G韩国首发:三星自家基带 实测速度破千兆
  2. 排列组合 南阳理工学院第三届省内高校新生程序设计大赛(决赛)A. 湮灭残昼
  3. 阿里巴巴的“旺信”上线
  4. python - sklearn 计算F1
  5. 如何实现U盘低格?这样操作快速搞定!
  6. 阿里最受追捧的「中高级技术核心」,助我拿下菜网offer,附面经
  7. 视频播放到一半就无法播放怎么修复?
  8. Adobe Creative Suite 3: Ready this year?
  9. 金融风控——Python建模
  10. oracle 修改 dbid,Oracle 在使用NID更改DBID时ORA-01122 ORA-01110 ORA-01206