这个记录一下,简单web端的登陆有空贴上来。此处是从浏览器手机一面走的。仅供参考

phone_url="***********&page={0}".format(h)header={"User-Agent":"*********",}req=requests.get(url=phone_url,headers=header)res_data=json.loads(req.text).get("data")detail_datas=res_data.get('c****ds')for detail_data in detail_datas:page_count += 1#非博客正文跳过if detail_data.get('car*****up'):continuedetail_data_all=detail_data.get('m****og')"""page_info media_info mp4_hd_url        """#点赞数zan_count=detail_data_all.get('attitudes_count',0)#评论数ping_count=detail_data_all.get('comments_count',0)#发布时间creat_time=detail_data_all.get('created_at')#图片pics=[i.get('url')  for i in detail_data_all.get('pics',[0]) if i !=[0]]#转发数reposts_count=detail_data_all.get('reposts_count','0')#视屏urlvideo_infos=detail_data_all.get('page_info')if video_infos:video_info=video_infos.get('media_info')if video_info:#视频urlvideo_url=video_info.get('m******rl')#视频播放人数video_see_count=video_info.get('play_count')#文本这处理稍微麻烦点#微博文本text_base = detail_data_all.get('t**t')weibo_text=text(header,detail_data_all,text_base)#转发文本retweeted_text=""retweeted_status=detail_data_all.get('retweeted_status')if retweeted_status:retweeted_texts=retweeted_status.get('text')retweeted_text=text(header,retweeted_status,retweeted_texts)h+=1res_until = res_data.get('cardlistInfo').get('page')if not isinstance(res_until,int):break

文本提取封装

def text(header,detail_data_all,text_base):isLongText = detail_data_all.get('isLongText')# 解决换行text_html = etree.HTML(text_base.replace("****", "\n"))# 有全文情况if isLongText:# 全文urlall_text_url = "https://m.weibo.cn" + text_html.xpath(r"//a[contains(text(),'全文') and contains(@href,'/status/')]/@href")[0]# print(all_text_url)all_text_req = requests.get(all_text_url, headers=header)# print(all_text_req.text)text_base= re.findall(r'"text": "(.*?)\n', all_text_req.text)[0]imgs = re.findall(r'<img.*?>', text_base)img = {}# 标签体替换图片连接i##笑脸等符号位置不变if imgs:for i in imgs:img_style = re.findall(r"style='(.*?)'", i)img['style'] = img_style[0] if img_style else ""img['src'] = re.findall(r"src=.*(//.*?png)", i)[0]img_alt = re.findall(r'alt=(.*?) ', i)img['img_alt'] = img_alt[0] if img_alt else ""text_base = text_base.replace(i, str(img)+',')text_html = etree.HTML(text_base.replace("*****", "\n"))# 提取文本text = text_html.xpath('string(.)').strip()return text

简单记录下,结果和页面出来的结果格式都一致某些原因注释了部分。条数和接口展示的总条数有十几条出入,检查程序并没有问题。登陆稍后贴

微博简单的免登陆获取相关推荐

  1. 易语言免登录获取QQ/昵称/头像/在线状态源码

    易语言免登陆获取q资料卡的源码. 例子: 取得登录q  获取状态:在线 昵称 x7st 获取本人描述等 没有调用第三方接口,纯QQpost稳定,需要的可以下载查看 下载地址:https://6yunp ...

  2. 【Python爬虫实例学习篇】——5、【超详细记录】从爬取微博评论数据(免登陆)到生成词云

    [Python爬虫实例学习篇]--5.[超详细记录]从爬取微博评论数据(免登陆)到生成词云 个人博客地址:ht/tps://www.asyu17.cn/ 精彩部分提醒: (1)微博评论页详情链接为一个 ...

  3. 40079 钉钉_钉钉获取免登陆授权码CODE,返回:不存在的临时授权码40078

    [官方正版]给孩子看的编程少儿读物 55.2元 (需用券) 去购买 > 最近在踩基于钉钉开放平台进行开发的坑,然后在进行身份认证时遇到了"钉钉获取免登陆授权码CODE,返回:不存在的临 ...

  4. 简单做了一个sina微博的MVC第三方登陆

    实现的效果是通过第三方sina登陆获取用户信息 现在我们讲述一下认证的步骤 1.第一步先获取sina认证的appkey,appSecret在地址http://open.weibo.com/wiki/中 ...

  5. iOS程序员眼中的客户端免登陆(数据迁移已更新)

    2017.01.15 一.前言,为什么要做免登陆 2017年1月9日,蓄势已久的小程序正式上线,着实,张小龙 用完即走 的理念发挥的淋漓尽致,无需下载,扫码可用,用完即走 2017年互联网人口红利结束 ...

  6. 钉钉微应用接入钉钉免登陆配置记录。NET实现

    在这里记录一下我配置的钉钉接入微应用遇到的坑.搞了我几天天才调通.头皮发麻,现在梳理一下,以免别人也入坑. 1.钉钉接入主要要获取钉钉企业员工的ID,然后去自己的应用的数据库里进行匹配然后实现免登陆的 ...

  7. 钉钉实现企业级微应用免登陆详解

    (一)基本概述: 钉钉中实现免登陆的核心思想就是通过corpId和corpSecret这两个参数来获得免登陆码Code,继而通过Code来获取用户信息,并在后台数据库中比对该用户信息是否存在,如果比对 ...

  8. dz3.2火车头 php接口,DiscuzX3.4论坛火车头采集器免登陆发布模块(附测试接口)!...

    今天来分享"DiscuzX3.4论坛火车头采集器免登陆发布接口模块(可测试)"大家可以复制下面的百度云地址进行下载,本接口是亲测的,压缩包无加密,可以直接使用,并且我们附有了使用教 ...

  9. destoon8.0火车头免登陆发布接口+全模块采集规则+主动推送百度

    destoon8.0火车头免登陆发布接口,不限制域名,支持全模块模拟采集更新外加入库自动推送百度. 下载地址:destoon8.0火车头免登陆发布接口+全模块采集规则+主动推送百度-68资源网dest ...

  10. 评论回复功能 asp.net_升级了!最新手机版本 PS 7.2 免登陆 解锁全部高级功能

    手机 PS 升级了!免登陆 解锁全部高级功能 最新安卓手机版 Photoshop Express 7.2 ADOBE公司为了方便手机摄影后期照片处理,特意开发了手机版本的PS,就是 Photoshop ...

最新文章

  1. linux shell 脚本入门
  2. 在Windows Mobile和Wince(Windows Embedded CE)下如何使用.NET Compact Framework开发进程管理程序...
  3. 总结下Mysql分表分库的策略及应用
  4. java 链接mysql 产生500W数据模拟生成环境
  5. 【numpy】np.random.normal()函数
  6. 长连接的定义及其优缺点 以及在不同的浏览器中的支持情况
  7. 菜鸟学习笔记:Java提升篇5(IO流1——IO流的概念、字节流、字符流、缓冲流、转换流)
  8. 【EMNLP2020】一种多层对多层的BERT蒸馏方法
  9. linux安装qq权限不够,[操作系统]Linuxqq安装及其所引发的问题{权限位是 777 (必须 =0755 且 =0755)}...
  10. 哈工大《工科数学分析》习题
  11. 台达变频器485通讯接线图_台达变频器怎么接线 台达变频器接线图详解
  12. 60天使用百词斩背单词的感想
  13. CTGU·OJ .特别的幸运数
  14. 分享一些可用的淘宝(1688)关于订单信息获取的相关接口(开放API收费)
  15. iOS开发雕虫小技之傻瓜式定位神器-超简单方式解决iOS后台定时定位
  16. AG9300|Type-C 转VGA数据转换器解决方案
  17. AI领域算法作者及项目直播分享汇总-不断更新ing
  18. Docker初级学习指南
  19. 三阶行列式的题目_考研数学 | 线性代数中的行列式重难点分析
  20. JDRead电子书使用心得

热门文章

  1. 一天破万:二十一个微信公众号推广技巧
  2. Excel如何将多个工作簿数据合并到一起
  3. digispark使用
  4. Ps如何制作动态图片
  5. HUAWEI 机试题:VLAN资源池
  6. 沟通类书籍推荐,这6本书助力你提高自身沟通能力
  7. android switch背景图片,修改SwitchCompat的背景图片
  8. excel 如何批量删除必表中的空白行
  9. Easyui--官网
  10. 多元统计分析--判别(距离判别、Fisher判别、Bayes判别)