该楼层疑似违规已被系统折叠 隐藏此楼查看此楼

#coding:utf-8

import urllib2

import urllib

import random

name=raw_input('请输入要爬取的贴吧名称:')

nume=input('输入要爬取的页数:')

#############################################

ip_list=['42.234.118.56:8118','175.154.50.127:8118','122.238.51.210:8118']

proxy=urllib2.ProxyHandler({'http':random.choice(ip_list)})

opener=urllib2.build_opener(proxy)

###############################################

user_list = ['Mozilla/5.0 (Windows NT 10.0; WOW64; rv:52.0) Gecko/20100101 Firefox/52.0','Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/57.0.2979.2 Safari/537.36']

headers = {'User-Agent':random.choice(user_list)}

############################################

x=0

for page in range(0,nume):

print '正在爬取第%s页...'%(page+1)

url='https://tieba.baidu.com/f?kw=%s&pn=%s'%(name,x)

x=x+50

values={}

data=urllib.urlencode(values)

print url

request=urllib2.Request(url,data,headers)

response=opener.open(request)

# print response.read().decode('utf-8')

html=response.read().decode('utf-8')

f=open(('%s_%s.html'%(name,(page+1))).decode('utf-8'),'w')

f.write(html.encode('utf-8'))

f.close()

python如何注释掉一段代码_爬取出来的网页代码都被注释掉怎么解决?相关推荐

  1. 代码注释掉还能执行_日志消息是可执行代码和注释

    代码注释掉还能执行 尽管在一个人的代码中应添加多少注释之间存在意见分歧,但我认为可以肯定地说,大多数开发人员都同意以下代码段中的注释是多余的: // increment the total total ...

  2. python 提取txt某一段内容_(转)提取TXT文本中指定内容——python

    项目介绍: 在PYTHON的计算机二级考试中有这么一个题,要求我们从一个文本中按照特定的格式提取指定内容. 文件名称为"论语-网络版.txt",其内容采用如下格式组织: [原文] ...

  3. 简单的签到代码_【SAS小恩的代码段】02样本分布、两群体与组合差异性检定

    为了响应停课不停学, 本人在吉林大学的课程教学上会大量使用SAS编程教学.同时本人撰写了两本SAS相关的教材,因此将会录制一连串视频,会以以下的材料陆续发布: ◆ SAS在财务研究中的应用  --&g ...

  4. python图书馆抢座代码_“我去图书馆”公众号代码抢座的实现

    因为要考研嘛,想去图书馆.我们学校是早上六点开抢,同学们太猛,我每天5点50起床抢,都不太抢的到想要的座位,于是我就花了个两三天琢磨着怎么用代码来实现这个抢座,目前已经完成,虽然因为微信的那个sess ...

  5. 天天向上续 python代码_第46p,8行代码,用Python批量重命名文件

    大家好,我是杨数Tos,这是<从零基础到大神>系列课程的第46篇文章,第二阶段的课程:Python基础知识:小案例之用Python批量重命名文件. 学习本课程,建议先看一遍:[计算机基础知 ...

  6. 如何编写无法维护的代码_编写可维护的前端代码

    点击这里获得更好的阅读体验​github.com 以下是本人在团队内部分享的整理和补充,水平有限,如有错误,请不吝赐教. 大家好,我叫王力国,目前是 RPA 前端团队负责人,过去一年我们从零构建了 R ...

  7. 小波分解与小波包分解代码_分解的功能参数和代码可维护性

    小波分解与小波包分解代码 Code keeps changing, there's no doubt about that. We always do our best to set some roc ...

  8. python 批量下载 代码_Python + Selenium +Chrome 批量下载网页代码修改

    Python + Selenium +Chrome 批量下载网页代码修改 主要修改以下代码可以调用 本地的 user-agent.txt 和 cookie.txt 来达到在登陆状态下 批量打开并下载网 ...

  9. mysql在哪里写代码_[译] 如何写好 Go 代码

    原文:https://scene-si.org/2018/07/24/writing-great-go-code/ 我写了多年的 Go 微服务,并在写完两本关于 (API Foundations in ...

最新文章

  1. C++的STL栈实现队列
  2. maven java 配置文件路径_Maven 的配置文件路径读取
  3. mysql常见死锁_MySQL死锁系列-常见加锁场景分析
  4. Mac电脑设置adb环境变量
  5. Get Started Part 2
  6. debug LUW1 - do binding workflow
  7. 精益或六西格玛已经不易了,为啥还需要“精益六西格玛”?
  8. 基于EfficientNet网络的植物叶部病害分类
  9. 数据预处理(normalize、scale)
  10. BestCoder Round #90 Kblack loves flag
  11. tutte定理证明hall定理_县级数学教研网课:有趣的勾股定理证明,课件用几何画板制作...
  12. python中将str转成数字_python初探: 数据类型与变量
  13. Mongodb db.serverStatus()所关心的几个输出值
  14. 类似%-30的字串解码办法
  15. 软考信息系统监理师 2016年3月18日作业
  16. WCF学习 (三)深入认识WCF契约
  17. Ubuntu 定时锁屏3.0
  18. git 某个文件回退到指定版本
  19. 单片机技术及应用:基于proteus仿真的c语言程序设计,《单片机的C语言程序设计与应用——基于Proteus仿真(第3版)》怎么样_目录_pdf在线阅读 - 课课家教育...
  20. 计算机科学人工智能的应用,计算机人工智能技术的应用与发展.pdf

热门文章

  1. eclipse failed to load the jni jvm.dll
  2. Android直连SQLServer
  3. Android4.4KitKat支持u盘功能
  4. 知乎专栏应用客户端源码项目
  5. linux安全加固(2)
  6. 用ASP.NET 重绘TabControl代码
  7. NYOJ 562 盒子游戏
  8. 如何识别一个指针式的时种的时间?
  9. shell 遍历目录下的所有文件
  10. UNIX V6内核源码剖析——unix v6 全貌