微博简单的免登陆获取
这个记录一下,简单web端的登陆有空贴上来。此处是从浏览器手机一面走的。仅供参考
phone_url="***********&page={0}".format(h)header={"User-Agent":"*********",}req=requests.get(url=phone_url,headers=header)res_data=json.loads(req.text).get("data")detail_datas=res_data.get('c****ds')for detail_data in detail_datas:page_count += 1#非博客正文跳过if detail_data.get('car*****up'):continuedetail_data_all=detail_data.get('m****og')"""page_info media_info mp4_hd_url """#点赞数zan_count=detail_data_all.get('attitudes_count',0)#评论数ping_count=detail_data_all.get('comments_count',0)#发布时间creat_time=detail_data_all.get('created_at')#图片pics=[i.get('url') for i in detail_data_all.get('pics',[0]) if i !=[0]]#转发数reposts_count=detail_data_all.get('reposts_count','0')#视屏urlvideo_infos=detail_data_all.get('page_info')if video_infos:video_info=video_infos.get('media_info')if video_info:#视频urlvideo_url=video_info.get('m******rl')#视频播放人数video_see_count=video_info.get('play_count')#文本这处理稍微麻烦点#微博文本text_base = detail_data_all.get('t**t')weibo_text=text(header,detail_data_all,text_base)#转发文本retweeted_text=""retweeted_status=detail_data_all.get('retweeted_status')if retweeted_status:retweeted_texts=retweeted_status.get('text')retweeted_text=text(header,retweeted_status,retweeted_texts)h+=1res_until = res_data.get('cardlistInfo').get('page')if not isinstance(res_until,int):break
文本提取封装
def text(header,detail_data_all,text_base):isLongText = detail_data_all.get('isLongText')# 解决换行text_html = etree.HTML(text_base.replace("****", "\n"))# 有全文情况if isLongText:# 全文urlall_text_url = "https://m.weibo.cn" + text_html.xpath(r"//a[contains(text(),'全文') and contains(@href,'/status/')]/@href")[0]# print(all_text_url)all_text_req = requests.get(all_text_url, headers=header)# print(all_text_req.text)text_base= re.findall(r'"text": "(.*?)\n', all_text_req.text)[0]imgs = re.findall(r'<img.*?>', text_base)img = {}# 标签体替换图片连接i##笑脸等符号位置不变if imgs:for i in imgs:img_style = re.findall(r"style='(.*?)'", i)img['style'] = img_style[0] if img_style else ""img['src'] = re.findall(r"src=.*(//.*?png)", i)[0]img_alt = re.findall(r'alt=(.*?) ', i)img['img_alt'] = img_alt[0] if img_alt else ""text_base = text_base.replace(i, str(img)+',')text_html = etree.HTML(text_base.replace("*****", "\n"))# 提取文本text = text_html.xpath('string(.)').strip()return text
简单记录下,结果和页面出来的结果格式都一致某些原因注释了部分。条数和接口展示的总条数有十几条出入,检查程序并没有问题。登陆稍后贴
微博简单的免登陆获取相关推荐
- 易语言免登录获取QQ/昵称/头像/在线状态源码
易语言免登陆获取q资料卡的源码. 例子: 取得登录q 获取状态:在线 昵称 x7st 获取本人描述等 没有调用第三方接口,纯QQpost稳定,需要的可以下载查看 下载地址:https://6yunp ...
- 【Python爬虫实例学习篇】——5、【超详细记录】从爬取微博评论数据(免登陆)到生成词云
[Python爬虫实例学习篇]--5.[超详细记录]从爬取微博评论数据(免登陆)到生成词云 个人博客地址:ht/tps://www.asyu17.cn/ 精彩部分提醒: (1)微博评论页详情链接为一个 ...
- 40079 钉钉_钉钉获取免登陆授权码CODE,返回:不存在的临时授权码40078
[官方正版]给孩子看的编程少儿读物 55.2元 (需用券) 去购买 > 最近在踩基于钉钉开放平台进行开发的坑,然后在进行身份认证时遇到了"钉钉获取免登陆授权码CODE,返回:不存在的临 ...
- 简单做了一个sina微博的MVC第三方登陆
实现的效果是通过第三方sina登陆获取用户信息 现在我们讲述一下认证的步骤 1.第一步先获取sina认证的appkey,appSecret在地址http://open.weibo.com/wiki/中 ...
- iOS程序员眼中的客户端免登陆(数据迁移已更新)
2017.01.15 一.前言,为什么要做免登陆 2017年1月9日,蓄势已久的小程序正式上线,着实,张小龙 用完即走 的理念发挥的淋漓尽致,无需下载,扫码可用,用完即走 2017年互联网人口红利结束 ...
- 钉钉微应用接入钉钉免登陆配置记录。NET实现
在这里记录一下我配置的钉钉接入微应用遇到的坑.搞了我几天天才调通.头皮发麻,现在梳理一下,以免别人也入坑. 1.钉钉接入主要要获取钉钉企业员工的ID,然后去自己的应用的数据库里进行匹配然后实现免登陆的 ...
- 钉钉实现企业级微应用免登陆详解
(一)基本概述: 钉钉中实现免登陆的核心思想就是通过corpId和corpSecret这两个参数来获得免登陆码Code,继而通过Code来获取用户信息,并在后台数据库中比对该用户信息是否存在,如果比对 ...
- dz3.2火车头 php接口,DiscuzX3.4论坛火车头采集器免登陆发布模块(附测试接口)!...
今天来分享"DiscuzX3.4论坛火车头采集器免登陆发布接口模块(可测试)"大家可以复制下面的百度云地址进行下载,本接口是亲测的,压缩包无加密,可以直接使用,并且我们附有了使用教 ...
- destoon8.0火车头免登陆发布接口+全模块采集规则+主动推送百度
destoon8.0火车头免登陆发布接口,不限制域名,支持全模块模拟采集更新外加入库自动推送百度. 下载地址:destoon8.0火车头免登陆发布接口+全模块采集规则+主动推送百度-68资源网dest ...
- 评论回复功能 asp.net_升级了!最新手机版本 PS 7.2 免登陆 解锁全部高级功能
手机 PS 升级了!免登陆 解锁全部高级功能 最新安卓手机版 Photoshop Express 7.2 ADOBE公司为了方便手机摄影后期照片处理,特意开发了手机版本的PS,就是 Photoshop ...
最新文章
- linux shell 脚本入门
- 在Windows Mobile和Wince(Windows Embedded CE)下如何使用.NET Compact Framework开发进程管理程序...
- 总结下Mysql分表分库的策略及应用
- java 链接mysql 产生500W数据模拟生成环境
- 【numpy】np.random.normal()函数
- 长连接的定义及其优缺点 以及在不同的浏览器中的支持情况
- 菜鸟学习笔记:Java提升篇5(IO流1——IO流的概念、字节流、字符流、缓冲流、转换流)
- 【EMNLP2020】一种多层对多层的BERT蒸馏方法
- linux安装qq权限不够,[操作系统]Linuxqq安装及其所引发的问题{权限位是 777 (必须 =0755 且 =0755)}...
- 哈工大《工科数学分析》习题
- 台达变频器485通讯接线图_台达变频器怎么接线 台达变频器接线图详解
- 60天使用百词斩背单词的感想
- CTGU·OJ .特别的幸运数
- 分享一些可用的淘宝(1688)关于订单信息获取的相关接口(开放API收费)
- iOS开发雕虫小技之傻瓜式定位神器-超简单方式解决iOS后台定时定位
- AG9300|Type-C 转VGA数据转换器解决方案
- AI领域算法作者及项目直播分享汇总-不断更新ing
- Docker初级学习指南
- 三阶行列式的题目_考研数学 | 线性代数中的行列式重难点分析
- JDRead电子书使用心得