不用Python获取小红书收藏夹内的视频
目录
前言
一、准备工具
二、使用步骤
1.获取收藏夹(专辑)的链接
2.没有安装Xpath Helper的安装Xpath Helper
3.利用Xpath提取所有视频的标题并用Excel进行简单处理
4.用Xpath提取视频的页面地址并用Excel处理
总结
前言
由于最近在整理自己的PS学习笔记,打开小红书发现内容很多,想获取个目录方便用思维导图整理并给带上视频链接以备复习,把自己的经验分享给大家
一、准备工具
- 一台装了谷歌浏览器,360极速浏览器等(具有审查元素和安装扩展插件的浏览器)
- 在浏览器安装Xpath Helper 扩展插件
- 需要用Excel处理拿到的链接(需要会一些Excel的相关操作,当然不会也没关系,可以看我发的详细步骤)
二、使用步骤
1.获取收藏夹(专辑)的链接
先用手机小红书APP打开收藏进入想爬取的一个专辑
进入专辑点击分享以获取专辑的链接
用微信把链接发到电脑微信文件传输助手上,并链接粘贴至电脑的浏览器(我使用的是360极速浏览器)然后可以进入看到这个收藏专辑
但是下滑滚轮我们可以看到在电脑的网页上只有一页,并不能看到这个收藏专辑的所有内容
此时我猜测小红书应该是限制了电脑端用户的浏览(因为小红书没有电脑端的软件,只有手机app)
那么,我尝试将浏览器标识换成手机端的。这里直接在页面 右击鼠标->点击审查元素->点击箭头所示的切换到仿真设备按钮(元素左边 的那个手机一样的图标)
点击之后,你发现再把鼠标移动到页面上时它变成了触摸小圆点,这表示你已经模拟成手机用户来浏览这个网站了。此时你需要按F5刷新一下页面,这样你再滑动滚轮就发现可以加载到更多的专辑内容了。
刷新后会这样显示
此时再滑动鼠标滚轮看下方的内容,发现一直有新的收藏内容可以被加载到了
我本来打算用python来爬这个专辑的所有内容,但因为这个页面的内容是动态加载的,还要分析XHR中的内容,写成代码也挺麻烦的,于是便不用python了。用xpath直接来提取内容更为方便。
我们先用鼠标滚轮一直向下滑加载出这个专辑的所有内容(就是滑到再向下滑啥也没有了)
2.没有安装Xpath Helper的安装Xpath Helper
没有装Xpath Helper先去扩展中心(红圈圈起来的地方)安装
3.利用Xpath提取所有视频的标题并用Excel进行简单处理
安装完成后回到小红书的那个界面点击Xpath Helper
然后会出现这样的一个框
因为有些人可能不知道xpth路径该怎么写,我这里直接给出,有兴趣的同学可以上网学习一下xpath路径怎么写
//div/h3
输入完成后是这样(这是提取了所有的视频标题)
来到右边的RESULTS框里Ctrl+a全选复制
接下来我们把它粘贴到Excel当中
在A的右边那个线上双击让它自动调整宽度
调整列宽后
4.用Xpath提取视频的页面地址并用Excel处理
然后回到页面继续提取视频链接
xpath写法如下
//div/a/@href
同样复制右边的链接到Excel进行粘贴并调整列宽大小
但是经过观察我发现了两个问题
问题一:
这并不是一个完整的链接还缺少前面的域名部分
完整的链接为这样,也就是说缺少了前面缺https://www.xiaohongshu.com
那么我们用Excel处理一下
选中B列插入一个新列
然后在新列中输入公式,然后按回车
="https://www.xiaohongshu.com"&C2
双击右下角那个绿色小块,进行智能填充
填充后是这样
因为引用了公式(公式里有C列),所以可以先复制一下B列
再在B列上右击粘贴值,把B列的内容转换成不带公式的文本,这样就可以把不需要的C列给删除了
但是点开发现这些链接中奇数列是视频地址,偶数列是作者的信息。所以我们通过建立一个辅助列来把奇数列给拿出来
同样双击右下角的那个绿色小圆块进行快速填充
把A列先剪贴到一个新的工作簿
回到sheet1
然后筛选出奇数列
然后把B列剪贴到sheet2里的B列,调整一下列宽
大功告成,点击链接就能打开相应的视频页了
总结
第一次在这里发教程,考虑到一些人不会用Excel处理这些数据,写的有些啰嗦。
下一篇文章写如何用python爬取这里所有视频页里的视频到自己的电脑上。
不用Python获取小红书收藏夹内的视频相关推荐
- Python 【企鹅号、QQ看点】短视频的自动上传与发布实例演示,同时支持抖音、快手、哔哩哔哩、小红书、微视、西瓜视频、视频号等平台的视频自动化同步发布
导读: 本系列依次介绍目前主流的短视频平台(抖音.快手.B站.小红书.微视.百度好看视频.西瓜视频.视频号.搜狐视频.一点号.大风号.趣头条等)的短视频自动发布,希望帮助大家更方便.高效的来进行自媒体 ...
- Python 【大风号】短视频的自动上传与发布实例演示,同时支持抖音、快手、哔哩哔哩、小红书、微视、西瓜视频、微信视频号等平台的视频自动化同步发布
导读: 本系列依次介绍目前主流的短视频平台(抖音.快手.B站.微视.小红书.好看视频.西瓜视频.视频号.搜狐视频等)的短视频自动发布,希望帮助大家更方便.高效的来进行自媒体的创作与管理. [本文介绍的 ...
- Python 【好看视频】短视频的自动上传与发布实例演示,同时支持抖音、快手、哔哩哔哩、小红书、微视、西瓜视频、微信视频号等平台的视频自动化同步发布
导读: 本系列依次介绍目前主流的短视频平台(抖音.快手.B站.微视.小红书.好看视频.西瓜视频.视频号.搜狐视频等)的短视频自动发布,希望帮助大家更方便.高效的来进行自媒体的创作与管理. [本文介绍的 ...
- Python 【抖音】短视频的自动上传与发布实例演示,同时支持快手、哔哩哔哩、小红书、微视、西瓜视频、微信视频号等平台的视频自动化同步发布
导读: 本系列依次介绍目前主流的短视频平台(抖音.快手.B站.微视.小红书.好看视频.西瓜视频.视频号.搜狐视频等)的短视频自动发布,希望帮助大家更方便.高效的来进行自媒体的创作与管理. [本文介绍的 ...
- Python 【快手】短视频的自动上传与发布实例演示,同时支持抖音、哔哩哔哩、小红书、微视、西瓜视频、微信视频号等平台的视频自动化同步发布
导读: 本系列依次介绍目前主流的短视频平台(抖音.快手.B站.微视.小红书.好看视频.西瓜视频.视频号.搜狐视频等)的短视频自动发布,希望帮助大家更方便.高效的来进行自媒体的创作与管理. [本文介绍的 ...
- Python 【搜狐号】短视频的自动上传与发布实例演示,同时支持抖音、快手、哔哩哔哩、小红书、微视、西瓜视频、微信视频号等平台的视频自动化同步发布
导读: 本系列依次介绍目前主流的短视频平台(抖音.快手.B站.微视.小红书.好看视频.西瓜视频.视频号.搜狐视频等)的短视频自动发布,希望帮助大家更方便.高效的来进行自媒体的创作与管理. [本文介绍的 ...
- Python 【哔哩哔哩】短视频的自动上传与发布实例演示,,同时支持抖音、快手、小红书、微视、西瓜视频、微信视频号等平台的视频自动化同步发布
导读: 本系列依次介绍目前主流的短视频平台(抖音.快手.B站.微视.小红书.好看视频.西瓜视频.视频号.搜狐视频等)的短视频自动发布,希望帮助大家更方便.高效的来进行自媒体的创作与管理. [本文介绍的 ...
- Python 【西瓜视频】的短视频自动上传与发布实例演示,同时支持抖音、快手、哔哩哔哩、小红书、微视、微信视频号等平台的视频自动化同步发布
导读: 本系列依次介绍目前主流的短视频平台(抖音.快手.B站.微视.小红书.好看视频.西瓜视频.视频号.搜狐视频等)的短视频自动发布,希望帮助大家更方便.高效的来进行自媒体的创作与管理. [本文介绍的 ...
- Python 【惠头条】短视频的自动上传与发布实例演示,同时支持抖音、快手、哔哩哔哩、小红书、微视、西瓜视频、视频号等平台的视频自动化同步发布
导读: 本系列依次介绍目前主流的短视频平台(抖音.快手.B站.小红书.微视.百度好看视频.西瓜视频.视频号.搜狐视频.一点号.大风号.趣头条等)的短视频自动发布,希望帮助大家更方便.高效的来进行自媒体 ...
最新文章
- 对复杂业务组件在实际开发过程中被调用的反思
- ArrayList、HashTable、List、Dictionary的演化及如何选择使用
- wordpress后台外观没有菜单和小工具的解决方法
- python 幂运算 整数_在Python中检查一个数字是否是另一个数字的幂
- redux中间件之redux-thunk
- android 05 桢布局:FrameLayout 网格布据 GridLayout
- git(4)---Git、Repo、Gerrit三者的区别
- 商汤科技回应“IPO推迟”:“被”IPO,还“被”推迟了
- Dubbo即将毕业,晋升为Apache顶级项目?
- 无法更新标识列 wechatid_天津塘沽企业标识标牌设计制作安装的过程
- 一个不简洁的约瑟夫环解法
- RNA-seq——五、根据差异基因画火山图、在火山图上标记基因名
- 笔记本可以连wifi,但很卡或者无法访问互联网的一种解决方法
- 搭建srs流媒体服务器
- Js常用40个页面效果
- 决定物联网安全的有哪些因素
- maven项目查看依赖树
- web入门 命令执行 web53-web55
- 前后端分离电商B2C模式之_后台_购物车
- 电信网通的IP地址分布
热门文章
- 抽样和抽样分布-样本比率的抽样分布
- python+tensorflow LeNet---深度学习MINST手写体训练识别
- 北大计算机学霸,国内大学“最牛的”一个班级,门槛极高,一般学霸根本进不去...
- 哈工大2023形式语言与自动机春季期末考试试题
- 从零实现无序抓取(四)如何获取点云位姿估计真值
- Spring框架漏洞总结
- python漫画滤镜怎么实现的_OpenCV图片漫画效果的实现示例
- Git错误:Incorrect username or password ( access token )
- day01_matploylib
- 时尚服装照片动态展示文字介绍视频模板