python爬取正确但不出文件_[求助] Python 爬虫爬取豆瓣_请不要害羞,语法没有报错,但是最终没有得到图片,请各位大神帮我看看,到底哪里出现了问题??急求...
don't be shy.py
#coding=utf-8
import requests #导入 requests 模块
from bs4 import BeautifulSoup #导入 BeautifulSoup 模块
import os #导入 os 模块
class haixiu():
def __init__(self): #类的初始化操作
self.headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64; rv:53.0) Gecko/20100101 Firefox/53.0'} #给请求指定一个请求头来模拟 ff 浏览器
self.web_url = 'http://www.dbmeinv.com/dbgroup/current.htm?gid=haixiuzu' #要访问的网页地址
self.folder_path = 'D:\haixiu' #设置图片要存放的文件目录
def get_pic(self):
print('开始网页 get 请求')
r = self.request(self.web_url)
print('开始获取所有 a 标签')
all_a = BeautifulSoup(r.text, 'lxml').find_all('a', class_='links') #获取网页中的 class 为 links 的所有 a 标签
print('开始创建文件夹')
self.mkdir(self.folder_path) #创建文件夹
print('开始切换文件夹')
os.chdir(self.folder_path) #切换路径至上面创建的文件夹
for a in all_a:
img_str = a['src']
print('a 标签的 style 内容是:',img_str)
img_name = a['title']
self.save_img(img_str, img_name) #调用 save_img 方法来保存图片
def save_img(self, url, name): ##保存图片
print('开始请求图片地址,过程会有点长...')
img = self.request(url)
file_name = name + '.jpg'
print('开始保存图片')
f = open(file_name, 'ab')
f.write(img.content)
print(file_name,'图片保存成功!')
f.close()
def request(self, url): #返回网页的 response
r = requests.get(url, headers=self.headers) # 像目标 url 地址发送 get 请求,返回一个 response 对象。有没有 headers 参数都可以。
return r
def mkdir(self, path): ##这个函数创建文件夹
path = path.strip()
isExists = os.path.exists(path)
if not isExists:
print('创建名字叫做', path, '的文件夹')
os.makedirs(path)
print('创建成功!')
else:
print(path, '文件夹已经存在了,不再创建')
beauty = haixiu() #创建类的实例
beauty.get_pic() #执行类中的方法
(望大神指点,谢谢!!)
python爬取正确但不出文件_[求助] Python 爬虫爬取豆瓣_请不要害羞,语法没有报错,但是最终没有得到图片,请各位大神帮我看看,到底哪里出现了问题??急求...相关推荐
- python爬取正确但不出文件_python爬取糗事百科,该如何正确保存到本地文件夹?报错-问答-阿里云开发者社区-阿里云...
我的程序已经可以爬取网络内容,但不太清楚怎么保存到当地文件夹,用网上方法试着做,但是有报错 import urllib import urllib.request import requests ## ...
- python爬取正确但不出文件_使用Python爬取微信公众号文章并保存为PDF文件(解决图片不显示的问题)...
前言 第一次写博客,主要内容是爬取微信公众号的文章,将文章以PDF格式保存在本地. 爬取微信公众号文章(使用wechatsogou) 1.安装 pip install wechatsogou --up ...
- python爬取正确但不出文件_使用BeautifulSoup进行Python抓取时不显示所有行
我是美容小组的新手.我试图从ESPN Fantasy Basketball Standings中获取"Season Stats"表,但并不是返回所有行.经过一番研究,我认为这可能是 ...
- 雪花飞舞的java程序_【图片】请问大神帮我看看一段代码,老是提示空指针异常【java吧】_百度贴吧...
该楼层疑似违规已被系统折叠 隐藏此楼查看此楼 import java.io.*; import java.util.*; class JavaFileList { public static void ...
- python爬虫爬取新闻实战01:小白如何迅速学会爬虫爬取上千条新闻
爬虫爬取新闻实战01:小白如何迅速学会爬虫爬取千条新闻 文章目录 爬虫爬取新闻实战01:小白如何迅速学会爬虫爬取千条新闻 1.前言 2 .爬虫原理介绍 2.1.图片爬虫 2.2 文字爬虫 3.用八爪鱼 ...
- python网络爬虫权威指南 豆瓣_豆瓣Python大牛写的爬虫学习路线图,分享给大家!...
豆瓣Python大牛写的爬虫学习路线图,分享给大家! 今天给大家带来我的Python爬虫路线图,仅供大家参考! 第一步,学会自己安装python.库和你的编辑器并设置好它 我们学习python的最终目 ...
- php输出后以密文显示,加密解密,_求大神帮看一下,如何根据下面的程序,把明文生成密文谢谢,加密解密 - phpStudy...
求大神帮看一下,如何根据下面的程序,把明文生成密文谢谢 求大神帮看一下,如何根据下面的程序,把明文生成密文谢谢 def parserLicense(self,encCode): data = base ...
- 机顶盒ttl无法输入_哪位大神帮帮忙,B860 AV1.1 TTL 无法输入命令
本帖最后由 wuli小茶 于 2018-1-27 11:10 编辑 求大神帮我下,请问这是什么情况,我想刷机,买了CH340G型号的USB转TTL模块,按教程连接后打开SecureCRT或putty都 ...
- 赫夫曼编码c语言 排序部分,c语言构造哈夫曼树输出哈夫曼编码出错 ,跪求大神帮我找错...
c语言构造哈夫曼树输出哈夫曼编码出错 ,跪求大神帮我找错0 youxun0952016.09.07浏览120次分享举报 #include #include #include typedef struc ...
最新文章
- ant models 内获取 url 的参数传递到组件
- nacos动态配置数据源_Jasper 怎么配置动态数据源
- html android canvas兼容_快来!这里有5分钟看完马上学会的HTML基础大全
- 解决QT无法调试问题-----the cdb process terminated
- rhel5.1 vncserver
- Python爬虫入门(5):URLError异常处理
- springmvc教程(4)
- 跑步运动轨迹计时小程序源码
- 一个高质量的程序应具备哪些条件?_有料!报考云南省考公务员,应具备哪些条件?...
- c语言编写计算器保存结果的程序,c语言编写计算器程序.doc
- 【Flink】flink ClickHouseSink--数据写入ClickHouse
- vue.js+boostrap最佳实践
- MySQL建表(那些字段必须)命令详解
- 使用 Navicat Premium12 创建报表
- 规划极限编程阅读笔记03
- 快递100企业版接口(API)实时查询、订阅推送、云打印、电子面单实现.Net版
- Java版 猜数字小游戏
- vue中拿到接口,并获取数据,渲染到页面
- [转载]打工辛酸路:我是一朵飘零的花之95
- GIS就业参考系列之技术篇——七种武器
热门文章
- 计算机在线采集数据注意,全站仪数据采集和传输中的常见问题解决方案
- dederss.php美国与,Dede经验:全站rss/连载和分类首页模板替换
- python算法详解张玲玲电子版_算法之路该如何学习?
- isdigit函数python检测数字个数_Python中判断字符串是否为数字的三个方法isdecimal 、isdigit、isnumeric的差别...
- Python这些操作,逆天且实用!
- 原创《SQL基础知识第2版》PDF高清版,限时下载!
- 2020最值得学习的12款python-web开发框架大盘点
- 26岁,发25篇SCI,当上211教授、博导。
- 不会代码,如何搭建一个个人博客?
- 打开程序时固定位置_新手入门第五课:免费开源图像处理程序GIMP之矩形选择工具...