最近在练习爬虫,试了试爬取百度百家号的作者粉丝数量,文中代码纯属练习专用。

import requests
import re
import json
from urllib import parsedef user_id(headers, search_word):"""通过URL查找百家号用户和其ID"""for page in range(0, 10000):# 单个关键词查找的页数page = str(page * 10)id_search_url = 'https://www.baidu.com/sf/vsearch?pd=userlist&from=844b&atn=index&tn=vsearch&ss=100&sa=tb&rsv_sug4=134&inputT=117&oq=' + search_word + '&word=' + \search_word + '&pn=' + page + '&data_type=json'search_re = requests.get(id_search_url, headers=headers)# write_txt(search_re.text)search_re_json = json.loads(search_re.text)try:user_num_id = search_re_json["data"]["datalist"]for id_list in user_num_id:# 取出用户ID和用户名和粉丝数量# print(id_list)# 用户IDid_num = id_list["third_id"]# 用户粉丝数fans_num = id_list["fans_num_ori"]# 用户名username = id_list["title"]write_csv(username, id_num, fans_num)# print(id_num)# print(fans_num)# print(username)# print(id_list)except Exception as e:break# write_csv(username, id_num, fans_num)def write_csv(username, id_num, fans_num):"""将获取到的数据写入文件"""url_path = r'./data/'with open(url_path + 'id.csv', mode='a+', encoding='utf-8') as fb:fb.write('\n')username = username.replace('<em>', '')username = username.replace('</em>', '')fb.write(username)fb.write(',')fb.write(str(id_num))fb.write(',')fb.write(str(fans_num))def write_txt(jj_re):"""将返回的JSOM写入文件"""url_path = r'./data/'with open(url_path + 'id.txt', mode='w+', encoding='utf-8') as fb:fb.write(jj_re)def main():"""主函数"""headers = {"User-Agent": "Mozilla/5.0 (iPhone; CPU iPhone OS 11_0 like Mac OS X) AppleWebKit/604.1.38 (KHTML, like Gecko) Version/11.0 Mobile/15A372 Safari/604.1"}# 需要搜索的关键词列表search_words = ['娱乐', '电影', '游戏']for search_word in search_words:# 编码字符encode_search_word = parse.quote(search_word)# print(encode_search_words)user_id(headers, encode_search_word)if __name__ == '__main__':main()

百度百家号作者昵称、ID、粉丝数量获取相关推荐

  1. 企业如何借助百度百家号进行网络推广?

    有些中小企业的网络推广需求很简单,就是想网上搜自己的品牌关键词及产品关键词能搜到自己企业的信息,这个最简单的方法就是用百度的百家号.百家号认证蓝V之后会增加一个百家名片的展示,且会给一些流量支持,相对 ...

  2. 爬虫如何爬取某领域下百家号作者列表

    分析百家号的作者的数据信息,发现在百家号中,每一个 appid 确定一个作者.(appid,听着也和作者author毫无联系,随即也想到,百家号早就支持作者通过API调用的形式去发布视频或者图文内容了 ...

  3. Android使用webview获取百度百家号网站源码

    Android使用webview获取网站源码 最近在使用webview去获取网页的源码,但是对于百度百家号的文章,网页的源代码获取出来只要标题,内容不见了,想问问有没有大佬知道这个问题.去用pytho ...

  4. 心已死,搜索引擎百度百家号已死!

    近日,我的百家号被百度封停!这让我不得不反思! 在现如今的自媒体时代,创作者们的无奈和心酸,既要满足用户的需要,取悦好用户,又得看自媒体平台的脸色,稍有不顺,可能要你所有的付出当是竹篮打水一场空.使我 ...

  5. 如何查看百度百家号审核进度

    百度百家号是一个比较新的自媒体,前段时间刚开放注册,但需要审核,有的朋友说秒过,有的反映说一直在等待审核中,如下图所示.百度占据了很大的流量入口,特别是pc端,然后又开放了作者广告收入模块,所以百家号 ...

  6. 百度百家号“漏洞”大曝光 一篇文章十几万阅读量 收入上万

    越来越发现自媒体的好处,就是现在太多的平台都提供入口,基本是四大门户还有三大巨头互联网公司,百度.腾讯 .阿里都提供!那么接下来我要分享的是中国最大的搜索引擎公司-百度!,相信最近很多人都知道百度百家 ...

  7. 采集百度百家号动态加载的数据信息

    问题:采集百度百家号 文章.动态.视频 的标题 ,发布时间 ,播放量 ,视频文件 阅读数等 代码: # coding = utf-8 import os import re import time i ...

  8. 【报告分享】2021内容行业研究报告-百度百家号新榜(附下载)

    摘要:近年来,用户对内容消费的需求迅速增加,内容平台百家齐放,为创作者提供了多种选择的机会.为进一步盘点目前内容行业的生态,加深创作者对内容行业发展现状及趋势的认知,为创作者更好地实现个人价值和商业价 ...

  9. 李彦宏直播首秀:来百度百家号APP带货没问题

    李彦宏直播首秀:来百度百家号APP带货没问题 直播作为一个新的媒体形式,通过百度平台来表达信息,来表达知识,那是非常必要的,所以我自己也想亲自体会,我有可能一些问题是比较偏门的问题,在百度里头搜不一定 ...

最新文章

  1. python练习册 每天一个小程序 第0004题
  2. 数学大神攻克猜字游戏Wordle,求解算法成绩逼近理论极限,连信息论都用上了...
  3. WINCE蓝牙应用开发方式
  4. Codeforces Testing Round #10 A. Forgotten Episode
  5. 点击链接如何直接跳转到相对应的聊天窗口
  6. 一分钟!不写代码!给网站添加【统计分析】
  7. UI版式设计模板,这样做才高级!
  8. numpy 矩阵 秩_Python(NumPy):集合只能映射秩1数组
  9. html导航条背景颜色代码,div+css实现鼠标经过背景高亮的导航菜单代码
  10. Delphi 仿QQ皮肤控件设计与运行效果图
  11. 天蝎项目整机柜服务器技术规范v1.01,天蝎项目整机柜服务器技术规范v1.01.doc
  12. 309. Best Time to Buy and Sell Stock with Cooldown**
  13. 免签接口 个人二维码收款系统/微信支付支付宝支付二维码监听自动发货/个人免签系统/个人免签支付 微信.支付宝 个人支付监控
  14. 牛客《今日头条》笔试题
  15. 迭代器 (Iterator迭代器接口)
  16. Reactive思考
  17. 信息系统的生命周期分为哪几个阶段?
  18. Android Gesture 手势识别使用实例
  19. Python分析《权力的游戏》最终季...... | 附源码
  20. Thinkphp开发的卡密商城平台,带数据库和文档,全开源方便二次开发

热门文章

  1. 如何给MFC对话框添加背景图片
  2. SpringBoot项目在使用Maven打包war中遇到的问题
  3. win10护眼模式_Win10系统中你不知道的小秘密,今天解开了,学会了提高工作效率...
  4. 黑白照片怎么上色?学会这招轻松解决
  5. 主成分分析(PCA)方法步骤以及代码详解
  6. 柱状图怎么添加数据python_Python数据可视化:如何用Matplotlib创建柱状图
  7. 我不爱的那个女人[转]
  8. 树莓派设置屏幕待机时间
  9. 从键盘输入的年份,判断该年是否是闰年
  10. 安卓4.4.4安装哪个微信版本_新版微信被网友骂惨了,后悔更新了吗?教你一招迅速回到旧版本...