根据微博用户名搜索爬取该用户userId并返回

import urllib.request

from urllib import parse

from bs4 import BeautifulSoup

# 微博根据用户名查找userId

# userName 用户名

# pageNum 查询页数,每页20个数据。 默认为第一页值为1,第二页值为2,以此类推。

def getUserId(userName, pageNum):

# 用户名需要URL编码后

html_doc = "https://s.weibo.com/user/&nickname=" + parse.quote(userName) + "&page=" + pageNum

req = urllib.request.Request(html_doc)

webpage = urllib.request.urlopen(req)

html = webpage.read()

soup = BeautifulSoup(html, 'html.parser')  # 文档对象

if soup:

print("找到html")

# 第一步:抓取a标签

# 暴烈甜心鳄鱼毛毛

for a in soup.find_all('a', class_='name'):

if a:

# 第二步:抓取a标签中用户名

rpuserName = a.get_text()

print("搜到用户名=" + rpuserName)

# 第三步: 判断是否有该用户,如果有,获取该用户userId

if a.get_text(strip=True) == userName:

print("匹配到该用户")

print("用户个人主页链接=" + a['href'])

# 第四步:提取userId,然后返回

userUrl = a['href'].split("/")

print(userUrl)

if userUrl and len(userUrl) > 0:

userId = userUrl[len(userUrl) - 1]

return "userId=" + userId

else:

return "userID抓取失败"

break

else:

return "没有查找到a标签"

else:

return "没有找到数据"

if __name__ == "__main__":

userName = "用户名"

print(getUserId(userName, "1"))

python爬取微博用户关注_Paython微博根据用户名搜索爬取该用户userId相关推荐

  1. python微博根据用户名搜索爬取该用户userId

    根据微博用户名搜索爬取该用户userId并返回 import urllib.request from urllib import parsefrom bs4 import BeautifulSoup# ...

  2. 爬取笔趣阁小说,并可以搜索爬取你喜欢的小说

    搜索进行爬取你自己喜欢的小说 我是一个小说爱好者,喜欢看小说,这也是我学习爬虫其中的一个原因. 我喜欢看网络小说,经常需要从网上下载小说.有的还不好找,有的下载不了,如果是正在更新的小说来说,就很难下 ...

  3. Scrapy豆瓣爬虫 爬取用户以及用户关注关系

    文章目录 明确任务 1.新建mysql数据库以及数据表 1.1 创建数据库 1.2 创建用户信息表users 1.3 创建用户关注表user_follows 笔记一: mysql中utf8与utf8m ...

  4. python爬取微博用户关注和粉丝的公开基本信息

    前言 本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理. 作者:TM0831 PS:如有需要Python学习资料的小伙伴可以加点击下 ...

  5. python爬取微博用户关注列表_GitHub - dataabc/weibo-follow: 爬取关注列表中微博账号的微博...

    爬取一个或多个指定微博用户关注列表中的微博账号,批量获取其user_id,并写入user_id_list.txt文件. 程序支持读文件,一个用户最多可以获取200个user_id,写入user_id_ ...

  6. python爬取微博用户关注_python爬取微博用户关注和粉丝的公开基本信息

    前言 本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理. 作者:TM0831 PS:如有需要Python学习资料的小伙伴可以加点击下 ...

  7. Python实现爬取移动端网页版微博用户信息及(部分)粉丝和(部分)关注信息(一)

    电脑端网页版微博weibo.com的处理相对复杂,先从最简单的移动端weibo.cn开始.因为微博系统限制,移动端只能查看前20页关注和粉丝信息,所以对于关注或粉丝超过200的用户,只能获取部分粉丝和 ...

  8. python爬虫批量抓取新浪微博用户ID及用户信息、微博内容

    老师给的任务,要对批量的微博文本进行舆情分析.第一步就是数据的抓取.在网上搜了一下大多是基于手机版网页(wap/cn)的爬虫,但是我在电脑上打不开这些网站. 由于自己也是网页小白,所以就参考着别人的代 ...

  9. Python 3.6实现单博主微博文本、图片及热评爬取

    CodingGo技术社区 自由的编程学习平台 文章简介 经常刷微博的同学肯定会关注一些有比较意思的博主,看看他们发的文字.图片.视频和底下评论,但时间一长,可能因为各种各样的原因,等你想去翻看某个博主 ...

最新文章

  1. Spring学习总结(6)——Spring之核心容器bean
  2. OPTEETrusted Application结构分析
  3. Docker学习总结(17)——学会使用Dockerfile
  4. SQL Server :理解GAM和SGAM页
  5. 【冒泡排序】c++实现冒泡排序代码
  6. QEMU仿真aarch64处理器运行Linux kernel
  7. Mac搭建Linux虚拟机
  8. 2022年伊始,IT圈还有这些事是你不知道的?
  9. HTML——<blockquote>与<q>的区别
  10. 《Robot Framework自动化测试修炼宝典》道长
  11. 北大计算机系赖陆程,北大计算机系一年级学生彭某从五楼阳台上跳下。彭某曾是一个相当聪明...
  12. onedrive手机客户端_OneDrive手机版
  13. 基于 ESP32 的高级气象站,带有 BME280 和实时天气数据
  14. CUDA out of memory(CUDA显存不足)
  15. 技术揭秘 | 互联网广告黑产盛行,如何反作弊?
  16. 51单片机学习笔记-7LED点阵屏
  17. H3C-IRF堆叠-VRRP双机热备-IPSecvpan
  18. early_param分析
  19. 自从学了这种数据可视化,Echarts、Python、Excel从此是路人
  20. 为什么需要Spring? 什么是Spring?带你由浅入深的方式进行介绍,只要你会编程就能看懂

热门文章

  1. 百济神州生物岛创新中心揭幕;朱秀轩博士出任天境生物总裁及董事 | 医药健闻...
  2. 腾讯Libpag动画库研究2(Pag实现原理)
  3. 最新版tensorflow1.12-gpu安装详细避坑(windows10 64位+anaconda+cuda+cudnn+pycharm环境配置)
  4. LVDS转LVDS,转VGA,TTL,HDMI
  5. The node was low on resource: ephemeral-storage. Container kube-proxy was using 12Ki, which exceeds
  6. C# 获取系统时间及时间格式
  7. 算法与程序设计—哥德巴赫猜想
  8. excel表格打印每页都有表头_Excel如何打印每页都有表头?固定表头打印方法
  9. Qt::设置QGridlayout控件充满整个单元格
  10. overflow属性html5,什么是css中overflow属性