python如何注释掉一段代码_爬取出来的网页代码都被注释掉怎么解决?
该楼层疑似违规已被系统折叠 隐藏此楼查看此楼
#coding:utf-8
import urllib2
import urllib
import random
name=raw_input('请输入要爬取的贴吧名称:')
nume=input('输入要爬取的页数:')
#############################################
ip_list=['42.234.118.56:8118','175.154.50.127:8118','122.238.51.210:8118']
proxy=urllib2.ProxyHandler({'http':random.choice(ip_list)})
opener=urllib2.build_opener(proxy)
###############################################
user_list = ['Mozilla/5.0 (Windows NT 10.0; WOW64; rv:52.0) Gecko/20100101 Firefox/52.0','Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/57.0.2979.2 Safari/537.36']
headers = {'User-Agent':random.choice(user_list)}
############################################
x=0
for page in range(0,nume):
print '正在爬取第%s页...'%(page+1)
url='https://tieba.baidu.com/f?kw=%s&pn=%s'%(name,x)
x=x+50
values={}
data=urllib.urlencode(values)
print url
request=urllib2.Request(url,data,headers)
response=opener.open(request)
# print response.read().decode('utf-8')
html=response.read().decode('utf-8')
f=open(('%s_%s.html'%(name,(page+1))).decode('utf-8'),'w')
f.write(html.encode('utf-8'))
f.close()
python如何注释掉一段代码_爬取出来的网页代码都被注释掉怎么解决?相关推荐
- 代码注释掉还能执行_日志消息是可执行代码和注释
代码注释掉还能执行 尽管在一个人的代码中应添加多少注释之间存在意见分歧,但我认为可以肯定地说,大多数开发人员都同意以下代码段中的注释是多余的: // increment the total total ...
- python 提取txt某一段内容_(转)提取TXT文本中指定内容——python
项目介绍: 在PYTHON的计算机二级考试中有这么一个题,要求我们从一个文本中按照特定的格式提取指定内容. 文件名称为"论语-网络版.txt",其内容采用如下格式组织: [原文] ...
- 简单的签到代码_【SAS小恩的代码段】02样本分布、两群体与组合差异性检定
为了响应停课不停学, 本人在吉林大学的课程教学上会大量使用SAS编程教学.同时本人撰写了两本SAS相关的教材,因此将会录制一连串视频,会以以下的材料陆续发布: ◆ SAS在财务研究中的应用 --&g ...
- python图书馆抢座代码_“我去图书馆”公众号代码抢座的实现
因为要考研嘛,想去图书馆.我们学校是早上六点开抢,同学们太猛,我每天5点50起床抢,都不太抢的到想要的座位,于是我就花了个两三天琢磨着怎么用代码来实现这个抢座,目前已经完成,虽然因为微信的那个sess ...
- 天天向上续 python代码_第46p,8行代码,用Python批量重命名文件
大家好,我是杨数Tos,这是<从零基础到大神>系列课程的第46篇文章,第二阶段的课程:Python基础知识:小案例之用Python批量重命名文件. 学习本课程,建议先看一遍:[计算机基础知 ...
- 如何编写无法维护的代码_编写可维护的前端代码
点击这里获得更好的阅读体验github.com 以下是本人在团队内部分享的整理和补充,水平有限,如有错误,请不吝赐教. 大家好,我叫王力国,目前是 RPA 前端团队负责人,过去一年我们从零构建了 R ...
- 小波分解与小波包分解代码_分解的功能参数和代码可维护性
小波分解与小波包分解代码 Code keeps changing, there's no doubt about that. We always do our best to set some roc ...
- python 批量下载 代码_Python + Selenium +Chrome 批量下载网页代码修改
Python + Selenium +Chrome 批量下载网页代码修改 主要修改以下代码可以调用 本地的 user-agent.txt 和 cookie.txt 来达到在登陆状态下 批量打开并下载网 ...
- mysql在哪里写代码_[译] 如何写好 Go 代码
原文:https://scene-si.org/2018/07/24/writing-great-go-code/ 我写了多年的 Go 微服务,并在写完两本关于 (API Foundations in ...
最新文章
- C++的STL栈实现队列
- maven java 配置文件路径_Maven 的配置文件路径读取
- mysql常见死锁_MySQL死锁系列-常见加锁场景分析
- Mac电脑设置adb环境变量
- Get Started Part 2
- debug LUW1 - do binding workflow
- 精益或六西格玛已经不易了,为啥还需要“精益六西格玛”?
- 基于EfficientNet网络的植物叶部病害分类
- 数据预处理(normalize、scale)
- BestCoder Round #90 Kblack loves flag
- tutte定理证明hall定理_县级数学教研网课:有趣的勾股定理证明,课件用几何画板制作...
- python中将str转成数字_python初探: 数据类型与变量
- Mongodb db.serverStatus()所关心的几个输出值
- 类似%-30的字串解码办法
- 软考信息系统监理师 2016年3月18日作业
- WCF学习 (三)深入认识WCF契约
- Ubuntu 定时锁屏3.0
- git 某个文件回退到指定版本
- 单片机技术及应用:基于proteus仿真的c语言程序设计,《单片机的C语言程序设计与应用——基于Proteus仿真(第3版)》怎么样_目录_pdf在线阅读 - 课课家教育...
- 计算机科学人工智能的应用,计算机人工智能技术的应用与发展.pdf