目录

前言

一、准备工具

二、使用步骤

1.获取收藏夹(专辑)的链接

2.没有安装Xpath Helper的安装Xpath Helper

3.利用Xpath提取所有视频的标题并用Excel进行简单处理

4.用Xpath提取视频的页面地址并用Excel处理

总结


前言

由于最近在整理自己的PS学习笔记,打开小红书发现内容很多,想获取个目录方便用思维导图整理并给带上视频链接以备复习,把自己的经验分享给大家


一、准备工具

  1. 一台装了谷歌浏览器,360极速浏览器等(具有审查元素和安装扩展插件的浏览器)
  2. 在浏览器安装Xpath Helper 扩展插件
  3. 需要用Excel处理拿到的链接(需要会一些Excel的相关操作,当然不会也没关系,可以看我发的详细步骤)

二、使用步骤

1.获取收藏夹(专辑)的链接

先用手机小红书APP打开收藏进入想爬取的一个专辑

进入专辑点击分享以获取专辑的链接

用微信把链接发到电脑微信文件传输助手上,并链接粘贴至电脑的浏览器(我使用的是360极速浏览器)然后可以进入看到这个收藏专辑

但是下滑滚轮我们可以看到在电脑的网页上只有一页,并不能看到这个收藏专辑的所有内容

此时我猜测小红书应该是限制了电脑端用户的浏览(因为小红书没有电脑端的软件,只有手机app)

那么,我尝试将浏览器标识换成手机端的。这里直接在页面 右击鼠标->点击审查元素->点击箭头所示的切换到仿真设备按钮(元素左边 的那个手机一样的图标)

点击之后,你发现再把鼠标移动到页面上时它变成了触摸小圆点,这表示你已经模拟成手机用户来浏览这个网站了。此时你需要按F5刷新一下页面,这样你再滑动滚轮就发现可以加载到更多的专辑内容了。

刷新后会这样显示

此时再滑动鼠标滚轮看下方的内容,发现一直有新的收藏内容可以被加载到了

我本来打算用python来爬这个专辑的所有内容,但因为这个页面的内容是动态加载的,还要分析XHR中的内容,写成代码也挺麻烦的,于是便不用python了。用xpath直接来提取内容更为方便。

我们先用鼠标滚轮一直向下滑加载出这个专辑的所有内容(就是滑到再向下滑啥也没有了)

2.没有安装Xpath Helper的安装Xpath Helper

没有装Xpath Helper先去扩展中心(红圈圈起来的地方)安装

3.利用Xpath提取所有视频的标题并用Excel进行简单处理

安装完成后回到小红书的那个界面点击Xpath Helper

然后会出现这样的一个框

因为有些人可能不知道xpth路径该怎么写,我这里直接给出,有兴趣的同学可以上网学习一下xpath路径怎么写

//div/h3

输入完成后是这样(这是提取了所有的视频标题)

来到右边的RESULTS框里Ctrl+a全选复制

接下来我们把它粘贴到Excel当中

在A的右边那个线上双击让它自动调整宽度

调整列宽后

4.用Xpath提取视频的页面地址并用Excel处理

然后回到页面继续提取视频链接

xpath写法如下

//div/a/@href

同样复制右边的链接到Excel进行粘贴并调整列宽大小

但是经过观察我发现了两个问题

问题一:

这并不是一个完整的链接还缺少前面的域名部分

完整的链接为这样,也就是说缺少了前面缺https://www.xiaohongshu.com

那么我们用Excel处理一下

选中B列插入一个新列

然后在新列中输入公式,然后按回车

="https://www.xiaohongshu.com"&C2

双击右下角那个绿色小块,进行智能填充

填充后是这样

因为引用了公式(公式里有C列),所以可以先复制一下B列

再在B列上右击粘贴值,把B列的内容转换成不带公式的文本,这样就可以把不需要的C列给删除了

但是点开发现这些链接中奇数列是视频地址,偶数列是作者的信息。所以我们通过建立一个辅助列来把奇数列给拿出来

同样双击右下角的那个绿色小圆块进行快速填充

把A列先剪贴到一个新的工作簿

回到sheet1

然后筛选出奇数列

然后把B列剪贴到sheet2里的B列,调整一下列宽

大功告成,点击链接就能打开相应的视频页了

总结

第一次在这里发教程,考虑到一些人不会用Excel处理这些数据,写的有些啰嗦。

下一篇文章写如何用python爬取这里所有视频页里的视频到自己的电脑上。

不用Python获取小红书收藏夹内的视频相关推荐

  1. Python 【企鹅号、QQ看点】短视频的自动上传与发布实例演示,同时支持抖音、快手、哔哩哔哩、小红书、微视、西瓜视频、视频号等平台的视频自动化同步发布

    导读: 本系列依次介绍目前主流的短视频平台(抖音.快手.B站.小红书.微视.百度好看视频.西瓜视频.视频号.搜狐视频.一点号.大风号.趣头条等)的短视频自动发布,希望帮助大家更方便.高效的来进行自媒体 ...

  2. Python 【大风号】短视频的自动上传与发布实例演示,同时支持抖音、快手、哔哩哔哩、小红书、微视、西瓜视频、微信视频号等平台的视频自动化同步发布

    导读: 本系列依次介绍目前主流的短视频平台(抖音.快手.B站.微视.小红书.好看视频.西瓜视频.视频号.搜狐视频等)的短视频自动发布,希望帮助大家更方便.高效的来进行自媒体的创作与管理. [本文介绍的 ...

  3. Python 【好看视频】短视频的自动上传与发布实例演示,同时支持抖音、快手、哔哩哔哩、小红书、微视、西瓜视频、微信视频号等平台的视频自动化同步发布

    导读: 本系列依次介绍目前主流的短视频平台(抖音.快手.B站.微视.小红书.好看视频.西瓜视频.视频号.搜狐视频等)的短视频自动发布,希望帮助大家更方便.高效的来进行自媒体的创作与管理. [本文介绍的 ...

  4. Python 【抖音】短视频的自动上传与发布实例演示,同时支持快手、哔哩哔哩、小红书、微视、西瓜视频、微信视频号等平台的视频自动化同步发布

    导读: 本系列依次介绍目前主流的短视频平台(抖音.快手.B站.微视.小红书.好看视频.西瓜视频.视频号.搜狐视频等)的短视频自动发布,希望帮助大家更方便.高效的来进行自媒体的创作与管理. [本文介绍的 ...

  5. Python 【快手】短视频的自动上传与发布实例演示,同时支持抖音、哔哩哔哩、小红书、微视、西瓜视频、微信视频号等平台的视频自动化同步发布

    导读: 本系列依次介绍目前主流的短视频平台(抖音.快手.B站.微视.小红书.好看视频.西瓜视频.视频号.搜狐视频等)的短视频自动发布,希望帮助大家更方便.高效的来进行自媒体的创作与管理. [本文介绍的 ...

  6. Python 【搜狐号】短视频的自动上传与发布实例演示,同时支持抖音、快手、哔哩哔哩、小红书、微视、西瓜视频、微信视频号等平台的视频自动化同步发布

    导读: 本系列依次介绍目前主流的短视频平台(抖音.快手.B站.微视.小红书.好看视频.西瓜视频.视频号.搜狐视频等)的短视频自动发布,希望帮助大家更方便.高效的来进行自媒体的创作与管理. [本文介绍的 ...

  7. Python 【哔哩哔哩】短视频的自动上传与发布实例演示,,同时支持抖音、快手、小红书、微视、西瓜视频、微信视频号等平台的视频自动化同步发布

    导读: 本系列依次介绍目前主流的短视频平台(抖音.快手.B站.微视.小红书.好看视频.西瓜视频.视频号.搜狐视频等)的短视频自动发布,希望帮助大家更方便.高效的来进行自媒体的创作与管理. [本文介绍的 ...

  8. Python 【西瓜视频】的短视频自动上传与发布实例演示,同时支持抖音、快手、哔哩哔哩、小红书、微视、微信视频号等平台的视频自动化同步发布

    导读: 本系列依次介绍目前主流的短视频平台(抖音.快手.B站.微视.小红书.好看视频.西瓜视频.视频号.搜狐视频等)的短视频自动发布,希望帮助大家更方便.高效的来进行自媒体的创作与管理. [本文介绍的 ...

  9. Python 【惠头条】短视频的自动上传与发布实例演示,同时支持抖音、快手、哔哩哔哩、小红书、微视、西瓜视频、视频号等平台的视频自动化同步发布

    导读: 本系列依次介绍目前主流的短视频平台(抖音.快手.B站.小红书.微视.百度好看视频.西瓜视频.视频号.搜狐视频.一点号.大风号.趣头条等)的短视频自动发布,希望帮助大家更方便.高效的来进行自媒体 ...

最新文章

  1. 对复杂业务组件在实际开发过程中被调用的反思
  2. ArrayList、HashTable、List、Dictionary的演化及如何选择使用
  3. wordpress后台外观没有菜单和小工具的解决方法
  4. python 幂运算 整数_在Python中检查一个数字是否是另一个数字的幂
  5. redux中间件之redux-thunk
  6. android 05 桢布局:FrameLayout 网格布据 GridLayout
  7. git(4)---Git、Repo、Gerrit三者的区别
  8. 商汤科技回应“IPO推迟”:“被”IPO,还“被”推迟了
  9. Dubbo即将毕业,晋升为Apache顶级项目?
  10. 无法更新标识列 wechatid_天津塘沽企业标识标牌设计制作安装的过程
  11. 一个不简洁的约瑟夫环解法
  12. RNA-seq——五、根据差异基因画火山图、在火山图上标记基因名
  13. 笔记本可以连wifi,但很卡或者无法访问互联网的一种解决方法
  14. 搭建srs流媒体服务器
  15. Js常用40个页面效果
  16. 决定物联网安全的有哪些因素
  17. maven项目查看依赖树
  18. web入门 命令执行 web53-web55
  19. 前后端分离电商B2C模式之_后台_购物车
  20. 电信网通的IP地址分布

热门文章

  1. 抽样和抽样分布-样本比率的抽样分布
  2. python+tensorflow LeNet---深度学习MINST手写体训练识别
  3. 北大计算机学霸,国内大学“最牛的”一个班级,门槛极高,一般学霸根本进不去...
  4. 哈工大2023形式语言与自动机春季期末考试试题
  5. 从零实现无序抓取(四)如何获取点云位姿估计真值
  6. Spring框架漏洞总结
  7. python漫画滤镜怎么实现的_OpenCV图片漫画效果的实现示例
  8. Git错误:Incorrect username or password ( access token )
  9. day01_matploylib
  10. 时尚服装照片动态展示文字介绍视频模板