运行报错:: 'str' object has no attribute 'items'

#-*-coding:utf-8 -*-

import urllib.request

def saveFile(data):

path = "E:\\123\\douban.out"

f = open(path,"wb")

f.write(data)

f.close()

url = "http://www.douban.com/"

headers = ("User-Agent: Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko)\

Chrome/58.0.3029.110 Safari/537.36 Edge/16.16299")

req = urllib.request.Request(url=url,headers=headers)

res = urllib.request.urlopen(req)

data = res.read()

saveFile(data)

data - data.decode("utf-8")

print(data)

print(type(res))

print(res.geturl())

print(res.info())

print(res.getcode())Traceback (most recent call last):

File "E:\抓取首图.py", line 13, in

req = urllib.request.Request(url=url,headers=headers)

File "C:\Users\w1553\AppData\Local\Programs\Python\Python36-32\lib\urllib\request.py", line 335, in __init__

for key, value in headers.items():

AttributeError: 'str' object has no attribute 'items'

python伪装浏览器什么意思_python爬虫伪装浏览器出现问题求助相关推荐

  1. python爬虫模拟浏览器的两种方法_python爬虫模拟浏览器访问-User-Agent过程解析

    这篇文章主要介绍了python爬虫模拟浏览器访问-User-Agent过程解析,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下 模拟浏览器访问-Use ...

  2. python requests库详解_python爬虫之路(一)-----requests库详解

    requests库 requests库是python实现的最简单易用的http库. requests库的功能详解. 我们可以自然而然地想到这些方法其实就是http协议对资源的操作. 调用request ...

  3. python爬取cctalk视频_python爬虫urllib使用和进阶 | Python爬虫实战二

    python爬虫urllib使用和进阶 上节课已经介绍了爬虫的基本概念和基础内容,接下来就要开始内容的爬取了. 其实爬虫就是浏览器,只不过它是一个特殊的浏览器.爬取网页就是通过HTTP协议访问相应的网 ...

  4. python 无头模式 绕过检测_python爬虫反反爬虫有绝技,轻松绕开百度人机验证!...

    你可能已经了解到了无头浏览器的作用以及使用的方法,那么本篇文章就让我们一起用无头浏览器做点事情. 是的你没有看错,我们要"搞"的对象就是百度指数这个网站,不知道你平时是否会应用到这 ...

  5. python爬取收费素材_Python爬虫练习:爬取素材网站数据

    前言 本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理. 在工作中的电子文案.ppt,生活中的新闻.广告,都离不开大量的素材,而素材 ...

  6. python爬取头条图集_Python爬虫基础练习(六) 今日头条街头篮球图片爬取

    今天我们要爬取的仍然是图片,不过与上一篇有所不一样的是,今天爬取的是今日头条上的图集,接着往下看吧~ 运行平台:Windows Python版本:Python3.6 IDE: Sublime Text ...

  7. python通过ip池爬_python 爬虫 代理ip池(适合初学者)

    初次学习python爬虫的朋友在频繁访问被爬取页面网站时都会被拦截,也就是限制ip.这里教教大家建立代理ip池. #!/usr/bin/env python3# -*- coding: utf-8 - ...

  8. python 突破b站验证码_Python爬虫模拟登陆哔哩哔哩(bilibili)并突破点选验证码功能...

    写在前面 今天带给大家一个突破点选验证码的案例,利用爬虫模拟登陆哔哩哔哩,并且把一些采坑的地方给大家强调一下! 一.需求分析 模拟登陆哔哩哔哩 网站链接: https://passport.bilib ...

  9. python 爬虫 伪装浏览器_python爬虫之浏览器伪装设置

    之前使用爬虫去爬取网页的时候,user-agent对应的是python自己的名字,这将会告诉网站管理员:我就是爬虫哦,我来爬取信息了,说不准就不能爬取信息了,因此,在实际操作中可以采用修改user-a ...

最新文章

  1. ggplot2中显示坐标轴_R可视化11|ggplot2-图层图形语法 (3)
  2. 华为H3C ER3100由器限速方法合集
  3. 傅德良:选择视频编码器的误区
  4. IDEA快捷键及xml文件中网址报错
  5. 大脑应对危机的模式_危机的完整形式是什么?
  6. 微软服务器配置核查,注册表配置检查
  7. vue.js v-for
  8. 2017,三大运营商的天猫芳华
  9. 如何实现python连续输入
  10. access insert语句怎么写_被缠上了,小王问我怎么在 Spring Boot 中使用 JDBC 连接 MySQL
  11. dw cs 5 安装失败解决方案
  12. 数据分析项目整理之用户消费行为分析
  13. Mono.Cecil FAQ文档翻译
  14. python 将JS(JavaScript)的json格式字符串转换为python的字典格式
  15. OWASP固件安全性测试指南
  16. 微信云开发 账号管理软件
  17. vscode html tab键补全插件_打造舒适的 VS Code 开发环境
  18. rpc服务器打开文档,“RPC服务器不可用”解决办法
  19. Android13 --- POST_NOTIFICATIONS权限无法关闭
  20. HCIA-Intelligent Computing 华为认证智能计算高级工程师(持续更新中5%)

热门文章

  1. java怎么抛出异常_java中如何抛出异常使程序不中断(7)
  2. 西交大计算机考博学术英语,2018年西安交通大学考博英语真题
  3. 剑指Offer——链表中倒数第K个节点
  4. POJ1821 单调队列//ST表 优化dp
  5. MyBatis课程5
  6. MongoDB 基础相关(二) 常用语句
  7. rel=nofollow
  8. Animation动画
  9. 【西安石油大学主办|IEEE CPS出版】2020智能控制、测量与信号处理国际学术会议诚邀您投稿参会!...
  10. 近期计算机视觉相关算法竞赛汇总—总奖池超553万人民币