python版贴吧_python 爬百度贴吧优化版1
coding=utf-8
#Version:python3.7.4
#Tools:Pycharm 2018.3.5
_date_ = '2020/8/2 22:26 '
import urllib.request
import urllib.parse
url="https://tieba.baidu.com/f"
name=str(input("请输入贴吧名称"))
#将贴吧名称变成url码
word=urllib.parse.quote(name)
num1=int(input("请输入开始页数"))
num2=int(input("请输入结束页数"))
ua_headers= {"User-Agent" : "Mozilla/5.0 (Macintosh; Intel Mac OS X 10_7_0) AppleWebKit/535.11 (KHTML, like Gecko) Chrome/17.0.963.56 Safari/535.11"}
#遍历起始页
for i in range(num1,num2+1):
#贴吧第一页 pn是0,第二页是50,第三页是100
num=50*(i-1)
#只有字符串才可以拼接
page=str(num)
#显示完整的网页
newUrl = url + "?kw=" + word + "&pn=" + page
print(newUrl)
#对网站提出请求
req = urllib.request.Request(newUrl, headers=ua_headers)
#读取网站数据
req1 = urllib.request.urlopen(req)
#读取数据
html=req1.read().decode()
#新建一个utf-8(如果不写默认为gbk)的,命名为paochong3的文档
f=open("c://paochong3.txt","w",encoding="utf-8")
#将数据写入文档中
print(f.write(html))
f.close()
print("保存%s贴吧的%s页成功"%(name,i))
python版贴吧_python 爬百度贴吧优化版1相关推荐
- python翻译器怎么用_Python使用百度翻译开发平台实现英文翻译为中文功能示例
本文实例讲述了Python使用百度翻译开发平台实现英文翻译为中文功能.分享给大家供大家参考,具体如下: #coding=utf8 import random import requests impor ...
- python版贴吧_python爬贴吧修改版本
#coding=utf-8 #Version:python3.7.4 #Tools:Pycharm 2018.3.5 _date_ = '2020/7/13 23:42 ' import urllib ...
- python获取天气分析_Python爬取南京市往年天气预报,使用pyecharts进行分析
上一次分享了使用matplotlib对爬取的豆瓣书籍排行榜进行分析,但是发现python本身自带的这个绘图分析库还是有一些局限,绘图不够美观等,在网上搜索了一波,发现现在有很多的支持python的绘图 ...
- python获取游戏数据_Python 爬取 3 万条游戏评分数据,原来程序员最爱玩的游戏竟然是.........
原标题:Python 爬取 3 万条游戏评分数据,原来程序员最爱玩的游戏竟然是...... 作者 |量化小白H 责编 | 胡巍巍 本文爬取了豆瓣游戏网站上所有可见的游戏评分数据进行分析,全文包括以下几 ...
- Python爬虫入门实例八之股票数据定向爬取并保存(优化版)
文章目录 写在前面 一.准备工作 1.功能描述 2.候选数据网站的选择 3.程序的结构设计 4.本篇选取的数据网站 (1)网站链接 (2)网站内容 二.数据网站分析 1.股票列表的分析 2.个股信息的 ...
- python 图片识别服装_Python爬取某东羽绒服数据,用可视化帮你挑选心仪的衣服...
本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,如有问题请及时联系我们以作处理. 以下文章附带菜J学Python ,作者J哥 刚接触Python的新手.小白,可以复制下面的链接去免 ...
- python微课教学_Python课程设计-微课视频版
第1章 序列应用--猜单词游戏 1.1 猜单词游戏功能介绍 1.2 程序设计的思路 1.3 关键技术 1.3.1 序列数据结构I 1.3.2 random模块 1.4 程序设计的步骤 第2章 函数应用 ...
- python分析b站_Python爬取并分析B站最热排行榜,我发现了这些秘密
现在大家的生活中,已经越来越离不开B站了,2020年的第一季度,B站月活跃用户达到了1.72亿,日活跃用户也已经突破了5000万个用户.源源不断的流量让B站的up主们也是粉丝数目不断暴涨,百万粉丝的u ...
- python足球联赛赛程_python爬取足球比赛赛程笔记
目标:爬取某网站比赛赛程,动态网页,则需找到对应ajax请求(具体可参考:https://blog.csdn.net/you_are_my_dream/article/details/53399949 ...
最新文章
- 《Imperfect C++中文版》——2.1 对象生命周期
- 【Qt开发】编译时报undefined reference to问题的解决方案
- eclipse中svn插件的安装
- 米哈游CEO蔡浩宇GDC演讲:《原神》如何打造动人的开放世界?
- 【Linux系统编程】进程同步与互斥:POSIX有名信号量
- 年轻——塞缪尔.厄尔曼
- [function.require]: Failed opening required 杰奇cms
- vcpkg安装_[工具]包管理工具Vcpkg 的使用
- 【ES】Es使用 报错 TransportClient llegalstateException : Unsupported transport.type [netty3]
- Git bash的中文化支持
- ipixsoft swf to html5 converter,iPixSoft SWF to Video Converter(视频转换软件)
- 毕业5年决定你的命运 --------值得所有不甘平庸的人看看
- 简单的爬虫(豆瓣250)
- Oracle11g64位安装教程
- 关于在GET请求中使用body
- linux桌面添加第三方软件图标
- IDEA debug热部署配置
- 职场生涯规划中必须学会的十种能力
- 新人成长:实习一个月感悟
- Java打开窗体基础用法