coding=utf-8

#Version:python3.7.4

#Tools:Pycharm 2018.3.5

_date_ = '2020/8/2 22:26 '

import urllib.request

import urllib.parse

url="https://tieba.baidu.com/f"

name=str(input("请输入贴吧名称"))

#将贴吧名称变成url码

word=urllib.parse.quote(name)

num1=int(input("请输入开始页数"))

num2=int(input("请输入结束页数"))

ua_headers= {"User-Agent" : "Mozilla/5.0 (Macintosh; Intel Mac OS X 10_7_0) AppleWebKit/535.11 (KHTML, like Gecko) Chrome/17.0.963.56 Safari/535.11"}

#遍历起始页

for i in range(num1,num2+1):

#贴吧第一页 pn是0,第二页是50,第三页是100

num=50*(i-1)

#只有字符串才可以拼接

page=str(num)

#显示完整的网页

newUrl = url + "?kw=" + word + "&pn=" + page

print(newUrl)

#对网站提出请求

req = urllib.request.Request(newUrl, headers=ua_headers)

#读取网站数据

req1 = urllib.request.urlopen(req)

#读取数据

html=req1.read().decode()

#新建一个utf-8(如果不写默认为gbk)的,命名为paochong3的文档

f=open("c://paochong3.txt","w",encoding="utf-8")

#将数据写入文档中

print(f.write(html))

f.close()

print("保存%s贴吧的%s页成功"%(name,i))

python版贴吧_python 爬百度贴吧优化版1相关推荐

  1. python翻译器怎么用_Python使用百度翻译开发平台实现英文翻译为中文功能示例

    本文实例讲述了Python使用百度翻译开发平台实现英文翻译为中文功能.分享给大家供大家参考,具体如下: #coding=utf8 import random import requests impor ...

  2. python版贴吧_python爬贴吧修改版本

    #coding=utf-8 #Version:python3.7.4 #Tools:Pycharm 2018.3.5 _date_ = '2020/7/13 23:42 ' import urllib ...

  3. python获取天气分析_Python爬取南京市往年天气预报,使用pyecharts进行分析

    上一次分享了使用matplotlib对爬取的豆瓣书籍排行榜进行分析,但是发现python本身自带的这个绘图分析库还是有一些局限,绘图不够美观等,在网上搜索了一波,发现现在有很多的支持python的绘图 ...

  4. python获取游戏数据_Python 爬取 3 万条游戏评分数据,原来程序员最爱玩的游戏竟然是.........

    原标题:Python 爬取 3 万条游戏评分数据,原来程序员最爱玩的游戏竟然是...... 作者 |量化小白H 责编 | 胡巍巍 本文爬取了豆瓣游戏网站上所有可见的游戏评分数据进行分析,全文包括以下几 ...

  5. Python爬虫入门实例八之股票数据定向爬取并保存(优化版)

    文章目录 写在前面 一.准备工作 1.功能描述 2.候选数据网站的选择 3.程序的结构设计 4.本篇选取的数据网站 (1)网站链接 (2)网站内容 二.数据网站分析 1.股票列表的分析 2.个股信息的 ...

  6. python 图片识别服装_Python爬取某东羽绒服数据,用可视化帮你挑选心仪的衣服...

    本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,如有问题请及时联系我们以作处理. 以下文章附带菜J学Python ,作者J哥 刚接触Python的新手.小白,可以复制下面的链接去免 ...

  7. python微课教学_Python课程设计-微课视频版

    第1章 序列应用--猜单词游戏 1.1 猜单词游戏功能介绍 1.2 程序设计的思路 1.3 关键技术 1.3.1 序列数据结构I 1.3.2 random模块 1.4 程序设计的步骤 第2章 函数应用 ...

  8. python分析b站_Python爬取并分析B站最热排行榜,我发现了这些秘密

    现在大家的生活中,已经越来越离不开B站了,2020年的第一季度,B站月活跃用户达到了1.72亿,日活跃用户也已经突破了5000万个用户.源源不断的流量让B站的up主们也是粉丝数目不断暴涨,百万粉丝的u ...

  9. python足球联赛赛程_python爬取足球比赛赛程笔记

    目标:爬取某网站比赛赛程,动态网页,则需找到对应ajax请求(具体可参考:https://blog.csdn.net/you_are_my_dream/article/details/53399949 ...

最新文章

  1. 《Imperfect C++中文版》——2.1 对象生命周期
  2. 【Qt开发】编译时报undefined reference to问题的解决方案
  3. eclipse中svn插件的安装
  4. 米哈游CEO蔡浩宇GDC演讲:《原神》如何打造动人的开放世界?
  5. 【Linux系统编程】进程同步与互斥:POSIX有名信号量
  6. 年轻——塞缪尔.厄尔曼
  7. [function.require]: Failed opening required 杰奇cms
  8. vcpkg安装_[工具]包管理工具Vcpkg 的使用
  9. 【ES】Es使用 报错 TransportClient llegalstateException : Unsupported transport.type [netty3]
  10. Git bash的中文化支持
  11. ipixsoft swf to html5 converter,iPixSoft SWF to Video Converter(视频转换软件)
  12. 毕业5年决定你的命运 --------值得所有不甘平庸的人看看
  13. 简单的爬虫(豆瓣250)
  14. Oracle11g64位安装教程
  15. 关于在GET请求中使用body
  16. linux桌面添加第三方软件图标
  17. IDEA debug热部署配置
  18. 职场生涯规划中必须学会的十种能力
  19. 新人成长:实习一个月感悟
  20. Java打开窗体基础用法

热门文章

  1. python去除字符串中的小括号和中括号大括号
  2. 19.python-多态
  3. C语言学习(九)之结构体
  4. 音乐背景声提取 matlab,获取抖音背景音乐Bgm提取方案-下载抖音背景音乐方法
  5. SpringBoot | 第零章:前言
  6. 半导体物理实验 03 - | 高频光电导法测少子寿命
  7. 采用外中断控制的条形LED彩灯设计
  8. 煤矿AI智能视频分析识别系统 opencv
  9. 【Java】GsonUtils(Gson 工具类)
  10. 了解南昌代理公司注册法律 以防被骗