php采集 今日头条链接,火车头按作者采集今日头条全部文章的方法
““前期9SiR在《》一文中谈到,自媒体文章一旦过了推荐期就不能持续为作者带来收益了,为了解决这一问题,可以自建网站(博客)来同步更新文章,通过经营网站来实现持续的盈利。
当你搭建起网站后,会发现前期在各大自媒体平台发布的几十篇甚至几百篇文章要同步到网站是一个浩大的工程。如9SiR在今日头条发布文章有二十多篇,如果靠纯手工搬运,至少需要半天的时间。
下面9SiR把今日头条文章同步到WordPress网站的方法跟大家分享一下。
使用工具:
抓包工具Fiddler
火车头采集器
WordPress免登陆发布模块
Unicode编码转换工具
通过Fiddler抓包获取头条个人主页真实地址。先在浏览器中打开自己在今日头条个人主页,然后打开Fiddler,点击菜单栏“文件”-勾选“捕获通信”(或按快捷键F12)开始抓包,回到浏览器刷新头条主页,刷新完成后回到Fiddler按下F12停止抓包。
把真实地址复制到浏览器打开,密密麻麻的加密的代码,通过在线“Unicode编码转换”工具,将加密代码解密。
找到第一篇文章的数据代码片段,其中包含第一篇文章的真实地址:
"source_url": "/item/6411865347309175297/"
启动火车头采集器新建采集任务,点击起始网址右侧“添加”,填入主页真实地址,地址中“count=20”代表获取前20篇文章,如果文章较多的话,将数字改成相应文章数量即可,然后依次点击“添加”和“完成”。
在“多级网址获取”文本框右侧点击添加,在弹出的对话框中,选择“手动填写链接规则”。
网址获取区域开始代码:"data"
网址获取区域结束代码:"is_self"
脚本规则:"source_url": "[参数]"
实际链接:http://今天头条网址/[参数1]
然后点击“保存”,至此网址采集规则填写完毕。
填写内容页采集规则。
在浏览器打开一篇文章,右键选择“查看源代码”。火车头采集器切换到“采集内容”选项卡,根据源代码填写标题、正文、等规则。
需要注意的是填写“内容”采集规则时,需要勾选“下载图片选项”并设置好图片保存的文件夹路径和文件名。
填写发布规则,这步需要事先下载“WordPress免登陆发布模块”并放入火车头采集器目录Module文件夹中。火车头采集器切换到“发布内容设置”选项卡,勾选“启用方式一:web在线发布到网站”,点击“web发布配置”,在弹出对话框中选择“WordPress4.X免登陆”,编码模式设为“UTF-8”,网站根地址填写你博客的首页地址,然后保存并选择该发布配置。
将免登陆发布模块相配套的文件“past.php”上传到网站根目录。
回到火车头采集器,勾选采集网址、采集内容和发布三个复选框,点击工具栏“开始按钮”,稍等几分钟,所有文章均被采集并发布到自建WordPress网站上,所有图片均下载到设置的文件夹内。
php采集 今日头条链接,火车头按作者采集今日头条全部文章的方法相关推荐
- 《火车头采集器采集网页数据》火车头配置规则采集信息文章数据。
此为火车头采集器的页面 *左边建立分组,建议结构都和所需要采集的数据结构一致,不然数据多了起来,很容易混乱. 1, 创建任务 起始网址是指你需要抓取的网址,例如:http://www.day.gov. ...
- 火车头按照关键词采集文章的平台有哪些?亲测实录!
很多网站现在都是按照关键词进行采集的,定向采集指定的内容,淘小白使用火车头采集,通过搜索词采集也采集过很多站点,今天来给大家总结一下! 目录: 1.搜词采集头条文章 2.搜词采集悟空问答 3.搜词采集 ...
- 今日头条的排名算法_今日头条搜索seo排名怎么做 今日头条搜索排名规则
既然今日头条宣布做搜索引擎,怎么少的了"头条seo"的研究呢? 一."头条seo"是什么? 头条seo指的是在今日头条app上用关键词搜索结果排名靠前.头条号称 ...
- .net版 类似火车头的网页采集
最近因工作需要,需写一个类似火车头的web采集器 各位有什么建议啊? 由于正则不会,只能简单的写一个测试代码,代码如下 代码 protected void Button1_Click(object s ...
- 头条号为什么把作者抛弃了?
<今日头条的流量哪里去了?>,在这篇文章中提到了一个关于头条号作者流量下滑的趋势.在头条横向扩张,将有限的流量分配给问答.微头条.短视频.火山小视频这些内容时,图文的流量出现了不可避免的下 ...
- 今日头条阅读量怎么刷_今日头条推广 今日头条阅读量怎么刷
今日头条推广怎么做呢,这是很多在做头条运营的小伙伴们都关心的问题.就让小编告诉你今日头条阅读量怎么刷吧~ 今日头条推广怎么做,每天坚持发几条原创高的今日头条,并且最好是对大家有帮助性过实用性,有内涵的 ...
- 哪种营销方法效果最差_今日头条广告投放形式分几种?头条品牌营销曝光效果哪种广告更好?...
一.今日头条广告形式分几种? 所以,广告主们也想借助今日头条投放广告.那么,今日头条怎么投放广告?今日头条平台有三种投放广告形式,开屏广告.信息流广告.详情页广告: 1.开屏广告 该广告位可以让你的产 ...
- Facebook WhatsApp开放「数据下载」;iPhone需求疲软引发恐慌;今日头条「更名」| CSDN 极客头条...
点击上方"CSDN",选择"置顶公众号" 关键时刻,第一时间送达! 「CSDN 极客头条」是从 CSDN 网站延伸至官方微信公众号的特别栏目,专注于一天业界事报 ...
- 今日头条阅读量怎么刷_揭露头条刷阅读量内幕:怎么刷的今日头条阅读量
如今,今日头条备受关注的底气,来自于让百度倒吸一口凉气的夸张数据: 截至2016年9月底,今日头条已有5.8亿用户,日活用户超过6300万,单用户日均使用时长超过76分钟. 也就是说,目前用户每天在今 ...
最新文章
- 约瑟夫问题(丢手帕问题)
- 1.Ping 的实现协议及原理
- 一个xmltojson类
- java城市公交查询系统案例_013JAVA.JSP城市公交查询系统.zip
- nested exception is org.springframework.beans.factory.BeanCurrentlyInCreationException(Spring循环依赖问题)
- react学习(45)----react组件
- On the coexistence of transport protocols in data centers
- mysql与tomcat_mysql数据库与tomcat服务器的一些细节问题
- IOS炫酷的引导界面
- 构建官方CoreOS COSA 镜像并构建 CoreOS
- Web常用对象(2)
- php要求输入是个数求平均值、_如何在Excel中求数字个数
- 计算机控制技术课程2018更新资料
- excel教程自学网_Office 全套办公软件自学视频教程word+excel+ppt
- 生意经:网店营销要搭强者的便车
- 【Linux】su 和 sudo 命令
- 李嘉璇:技术人如何深入人工智能
- Django建立一个音乐网站(一)
- rn 滑动验证_rn-fetch-blob
- ffmpeg源码精读1,音视频处理概述