爬取美食杰川菜照片及照片命名
小作品:爬取美食杰川菜的照片,并实现照片命名。喜欢的一健三连
直接上代码,交流的可以私信或留言!!!
(下载原材料与菜名匹配没有完成,待后续...)
from lxml import etree
from urllib.request import urlopen,Request
import requests
import os
def get_url():url='https://www.meishij.net/caixi/chuancai/'headers={"user-agent":"Mozilla/5.0 (Windows NT 6.1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/86.0.4240.198 Safari/537.36"}res=requests.get(url,headers=headers)return resdef xpath_get(res):path_pic="E://meishijie_pic//"root=etree.HTML(res.text)items=root.xpath('/html/body/div[2]/article/div[2]/div[1]/div')#print(items)'''#爬取主要美食主要食材for each in items:materal=each.xpath('./a/span/text()')''' for each in items:food_picture=str(each.xpath('./div/a[1]/@style')).split('(')[-1].split(')')[0]food_name=str(each.xpath('./a/strong/text()')).split('\'')[1]#去除名字中单引号#path=path_pic+food_picture.split('/')[-1]#这里使用food_picture纯粹是为了给图片命,看下面path=path_pic+food_name+'.jpg'#照片命名try:if not os.path.exists(path_pic):os.mkdir(path_pic)#print("文件创建成功")r=requests.get(food_picture)#print(r)with open(path,'wb')as f:f.write(r.content)f.close()#print("文件保存成功")except:print("文件爬取失败!")def main():#url定义这边加一个for循环实现多页爬取res=get_url()xpath_get(res)if __name__=="__main__":main()
爬取美食杰川菜照片及照片命名相关推荐
- 案例精选:爬取美食杰所有图片批量下载并入库
import shutil,os #文件处理的高级模块 from bs4 import BeautifulSoup from urllib.request import Request,urlopen ...
- python3APP爬虫--爬取王者荣耀小姐姐cosplay照片(附源码)
文章目录 一.絮叨 1.接上 2.启下 二.代码 三.查看数据 四.总结 一.絮叨 1.接上 自己挖的坑,自己填.上一篇python3APP爬虫–爬取王者荣耀英雄图片(附源码)爬取了王者荣耀英雄图片, ...
- 使用Python爬取马蜂窝网站的游记和照片
使用Python爬取马蜂窝网站的游记和照片 特殊原因需要在马蜂窝上爬取一些游记和照片作为后续分析处理的数据,参考网上一些类似的爬虫文章,自己尝试了一下,这次爬取的是马蜂窝上所有有关苏州的游记(包括游记 ...
- 爬取糗事百科上的照片
"明月如霜,好风如水,清景无限 " 爬取图片,是一项很常见的需求,后期文远会尝试一些反反爬策略爬取一些美妙的图片,尽请期待. 壹 直接分析,找到只有图片的网址: 同样打开开发者 ...
- 爬虫学习(11):爬取虎牙美女直播高清照片
本来想展示下爬取下来的图片,结果被官方审核未通过,说内容低俗,所以我就不放图了,可以自己去跑一下,开车了,哈哈,感觉不怎么低俗吧,害,上代码! import requests from lxml im ...
- 我用Python爬取美食网站3032个菜谱并分析,没有我不会做的菜!
这是巨变的中国,人和食物,比任何时候走的更快.近日,J哥为了寻味中国,奔走于某五线城市的大街小巷,结果除了累,啥也没寻到. 于是,J哥默默打开了各大美食网站,如豆果美食.下厨房.美食天下等.经过甄选, ...
- 爬取唯美女生网站上所有小姐姐的照片
爬取唯美女生网站 前几天刚好看到有人在教学爬取唯美女生网站(https://www.vmgirls.com)的图片,大致听了一下,只是介绍了一次爬取某一个小姐姐的照片,因此就尝试做一个爬取全站小姐姐照 ...
- 基于python3.x的爬取马蜂窝旅游的游记照片
前几天在csdn首页看到一个大佬爬取看准网数据并分析的博客,自己搞了一下,各种问题,已超过目前的认知领域,so,先从基本的做起吧,一点点添加新内容. 本次任务为爬取马蜂窝旅行达人的游记照片,之前搞过几 ...
- 使用python爬取携程网旅游信息(包含景点、酒店、美食)
其中本次爬虫的主要思想是:首先是找到携程网url的编写规律,然后根据规律使用beautifulsoup4对所需的html语言中的信息提取,最后就是封装处理.爬取的信息只是用来本次毕设的研究非商业用途. ...
最新文章
- NetFlow是一种数据交换方式,提供网络流量的会话级视图,记录下每个TCP/IP事务的信息...
- FineReport——设计时无相关数据库查看权限,使用对应数据库解决方案
- saltstack的安装(转载连接)
- 想给男友一个惊喜,没想到是这样的结局......
- python每天定时9点执行_python 定时器每天就执行一次的实现代码
- switch case 支持的 6 种数据类型
- c++多态--2(计算器,纯虚函数和抽象类)
- 世界之窗浏览器删除文本框信息_文本框——Excel里的便利贴
- 这个教程价值有点高,利用Python制作全自动化营销软件!
- 唯一《可解释机器学习》中文书来了:复旦研究生翻译,原作者转发点赞
- 22.创建DockWidget
- 分享程序员成长故事 解析IT职场困惑
- 玻璃质感_几何体素描画法:几何体画法步骤教程和玻璃质感画法教程,快学习...
- [转]新建一个Android工程项目
- 微信小程序引入 vant UI组件库
- Vue移动端 手机六位数密码框
- WebRTC收集网卡地址信息 源码剖析
- html标签选择器只认最后一个,选择某类的最后一个元素——CSS3伪类选择器走过的坑...
- java星号心形代码_c语言实现星号爱心的代码
- ubuntu打开摄像头测试