下载 tumblr 标记为喜欢的内容
源代码发布在github : get_tumblr_likes
一、介绍
本项目使用 python 编写,分析 tumblr 账户中喜欢的内容,给出资源链接,并下载。
其中 test.json
是一份 tumblr 返回的喜欢数据的 json 示例,提取里面图片和视频的资源地址后下载,下载的内容如下图。
二、使用方法
首先,你需要通过 tumblr API 来获取账户喜欢内容。这个过程是需要通过 OAuth 认证的,具体可参看这个网页
得到认证后可以通过脚本来获取资源内容,也可以通过这个网页来查询,结果会通过 json 的形式返回
保存你得到的 json 数据,命名为
test.json
,执行命令python json_parse.py
,这可以从 json 文件中提取出资源的真正链接,并存为url_list.txt
文件
执行
python download.py
,之后资源文件就会挨个下载到 download 文件夹下
三、其他
由于众所周知的原因,tumblr 的资源地址是不能直接下载的,因此需要设置代理。测试时使用 ssr 代理本地连接,因此
download.py
中有PROXIES = { "http": "http://127.0.0.1:1080", "https": "https://127.0.0.1:1080" }
,如果是在可直接访问 tumblr 的 VPS 上运行,可对代码做如下修改。# r = requests.get(url,proxies=PROXIES) # use proxyr = requests.get(url) # directly access
这个项目下载的是账户中的喜欢内容,因此需要进行认证。如果是下载某个账户发布的内容,可使用tumblr-crawler,再次感谢 tumblr-crawler 项目
转载于:https://www.cnblogs.com/cyang812/p/8954570.html
下载 tumblr 标记为喜欢的内容相关推荐
- 如何写出百度搜索喜欢的内容?这3大方法,你知道几个?
想获得更多百度搜索流量,还要懂得如何去打造百度更喜欢的内容.所以这次就从内容领域来跟大家简单聊聊: 应该如何写出百度喜欢的内容? 以下为本文内容提要: 1 什么是优质页面? 很多写内容的人都觉得,明明 ...
- [福利]如何下载Tumblr的视频
Tumblr是Yahoo旗下的轻博客,可以让使用者写日志,也能上传视频,那如果你把视频上传后想要下载下来怎么办呢?右键好像无法另存,不用担心,现在透过线上服务也能将Tumblr上的视频轻松下载下来保存 ...
- 下载/拷贝下来的压缩包打开内容为空解决方案
下载/拷贝下来的压缩包打开内容为空解决方案 参考文章: (1)下载/拷贝下来的压缩包打开内容为空解决方案 (2)https://www.cnblogs.com/zhenglw/p/11171872.h ...
- 如何下载新浪播客视频内容
如何下载新浪播客视频内容 2007-03-30 09:42 当今在一些播客网站上的一些视频,这种新兴的格式叫FLV全称为Flash Video.它的出现有效地解决了视频文件导入Flash后,使导出的S ...
- 短视频用户群体分析,男女性别分布如何,喜欢什么内容?
中国最大的短视频平台应该当属抖音,抖音每天有数以亿计的用户在其中流连忘返.那么这些用户都是谁呢?他们喜欢什么样的内容呢?我们通过平台利用数据分析和可视化,来了解一下抖音用户的画像. 抖音用户性别分布 ...
- 根据文献标题免费下载PDF格式文件的文献内容
根据文献标题免费下载PDF格式文件的文献内容 通过文献名下载文献:较为通用,如有不能下载情况请留言. 第一步:根据文献名,查出文献的DOI. 进入https://www.crossref.org/ , ...
- 互联网产品经理喜欢的内容,连张小龙都主动加微信的男人写的
以下鸡汤是马化腾,张小龙都点赞打赏的男人写的朋友圈. 1. 缺乏计划的目标,只是许愿而已. --2018.01.12 2. 意识到自己是房间里最聪明的人,才是最糟糕的感觉. --2018.01.14 ...
- java下载Excel文件并设置表头内容与下拉框
干货干货直接上代码 Maven依赖 <dependency><groupId>org.apache.poi</groupId><artifactId>p ...
- 使用idm下载新闻视频(bbc)及百度云盘内容
最近在寻找一些视频以做不可描述之用,但是在搜集资源的过程中,发现很多的视频没法直接下载(特别是新闻视频).在本人孜孜不倦的努力研究下终于找到了一种下载视频的好方法(其实是公司内的一位多年老司机前辈所授 ...
最新文章
- Java中父类方法重写有哪些需要注意的?
- 利用Oracle分析函数实现多行数据合并为一行
- 线程和进程 linux,Linux查看进程的所有子进程和线程
- docker 服务器engin开放2376端口给pycharm连接
- 网络规划设计师学习攻略(2)
- 腾达路由器dns服务器未响应,腾达路由器的设置方法
- ModuleNotFoundError: No module named ‘exceptions‘
- linux (centos 8.1)生产环境基于9台物理机 安装 opentstack ussuri集群以及集成ceph (已转gitee)
- web安全之逻辑漏洞
- tolist()的作用
- MS SQL2000 数据库置疑解决方法
- VS2008 Pocket PC 2003 SE仿真程序上网设置
- 全攻略:实现pynq-z2条形码识别
- Commander(指挥官)介绍
- esim办理出现差错_中国联通科普eSIM卡使用攻略 关于eSIM卡常见问题答疑
- 硬盘检测工具HARD DISK SENTINEL PRO(硬盘哨兵)v5.70便携版
- 使用echartJs展示报表广东省地图+柱状图
- 如何用计算机打出下划线,哪位可以告诉我在电脑上怎么打下划线
- Machine Learning introduction
- Android中常见五种布局管理器——RelativeLayout、LinearLayout、FrameLayout、TableLayout、GridLayout