微信公众号文章质量评分算法详解
作为一个多年的微信公众号作者,了解微信公众号文章打分的机制是十分有必要的。微信在后台其实有一整套的打分机制,今天基于腾讯的这篇Paper《Cognitive Representation Learning of Self-Media Online Ariticle Quality》为大家介绍下文章质量打分背后的算法理论。
在这篇paper中其实重点分享了两个方面,一方面是文章质量分的深度学习模型设计方法,另一方面是训练数据的构造法。
1 文章质量分模型架构设计方法
整个模型的设计分为两层,第一层是蓝、粉、绿这三个模块,作为基础的文章质量embedding生成层。第二层是最上方的FC Layer全连接层,这一层主要是做评分。
论文里把上面这个网络架构叫做CoQAN,文章质量分的训练模式被当成了二分类问题。
在模型设计上分为三个独立的模块(Subnetwork),分别是:
Layout Organization Subnetwork:布局结构判断网络,用来生成布局相关的评分
Writing Characteristics Subnetwork:协作风格判断网络,用来评估文章的写作风格
Text Semantics Subnetwork:语意深度判断网络,用来评估文章内容的质量
(1)Layout Organization Subnetwork
在布局评估网络中,主要通过循环网络算法GRU去判断图片、文本、视频的布局结构。
每段文章或者视频或者图片叫做一个block,GRU算法用来表述上下block结构pattern,用CNN表述block内部的布局。然后GRU和CNN综合起来
(2)Writing Characteristics Subnetwork
这个网络主要解决的是如何评估文章的协作风格,更多的是NLP方面的一些特征的挖掘,比如标题长度、核心词的个数、文章长度、n-gram、图片和文章的比例、图片数量、文章数量等。
然后利用one-hot编码就可以得到原始特征,然后还可以用一些特征交叉去生成一些交叉特征。
(3)Text Semantics Subnetwork
语意理解模型,通过优化bert模型形成hi-bert模型。hi-bert模型可以挖掘句子和词之间语意关系,找到主题和文章的语意深度。
2 文章质量分模型训练数据
上文介绍了文章评分模型的结构,在Paper的结尾片段还介绍了训练数据的构建方式。文章质量分训练可以看作是一个二分类问题,所以需要选择正样本和负样本。
正样本的标准是高等级的账号发表,具备比较高的喜欢、分享次数,不符合标准的被作为负样本。最终Paper中的模型训练使用了22054篇文章作为正样本,16194篇文章作为负样本。
最终在与其它文章质量分模型的比较中,CoQAN取得了比较好的结果:
微信公众号文章质量评分算法详解相关推荐
- 微信公众平台菜单编辑php,如何使用Vue.js实现微信公众号菜单编辑器(思路详解)...
这次给大家带来如何使用Vue.js实现微信公众号菜单编辑器(思路详解),使用Vue.js实现微信公众号菜单编辑器的注意事项有哪些,下面就是实战案例,一起来看一下. 学习一段时间Vue.js,于是想尝试 ...
- 微信公众号登录密码参数加密详解
微信公众号登录密码pwd参数加密详解 前言 此参数的加密没有任何难度,适合小白练手学习. 网址:https://mp.weixin.qq.com/ 一.打开浏览器开始抓包 输入错误的账号密码,登录.然 ...
- 微信登录(微信公众号授权)的开发(详解)
1.UnionId和OpenId 微信登录最重要的两个返回信息,一个是UnionId,一个是OpenId.两者之间有着必然的联系. 首先,先来理一下微信开放平台的架构.开发微信登录,必须有一个开放平台 ...
- 微信登录 sdk 服务器,微信登录(微信公众号授权)的开发(详解)——两三行代码的事,何必呢...
新版重构的SDK已经开始在写了,具体的使用方法参考 新版重构的SDK已经开始在写了,具体的使用方法参考 新版重构的SDK已经开始在写了,具体的使用方法参考 新版重构的SDK已经开始在写了,具体的使用方 ...
- 微信公众号回调地址设置(实战详解)
操作步骤如下: 1.登录微信公众平台微信公众平台 2.设置与开发->基本配置 参数说明: 服务器地址(URL):编辑好服务器配置后,点击保存,微信会对这个地址发送请求验证,验证通过后才能保存成功 ...
- python下载微信公众号文章_python如何导出微信公众号文章方法详解
1.安装wkhtmltopdf 下载地址:https://wkhtmltopdf.org/downloads.html 我测试用的是windows的,下载安装后结果如下 2 编写python 代码导出 ...
- python 公众号文章发布_python如何导出微信公众号文章方法详解
1.安装wkhtmltopdf 下载地址:https://wkhtmltopdf.org/downloads.html 我测试用的是windows的,下载安装后结果如下 2 编写python 代码导出 ...
- 微信公众号文章搜索接口9大详解
微信公众号作为一个重要的自媒体平台,越来越受到人们的关注.而对于那些想要提高自己公众号文章点击率的人来说,微信公众号文章搜索接口是一个不可或缺的工具.本文将从以下9个方面详细介绍微信公众号文章搜索接口 ...
- Python 爬取微信公众号文章和评论 (有源码)
关注我,一个仍存梦想的屌丝程序员,每天为你分享高质量编程博客. follow us for dream 关注我回复 "微信爬虫" 获取源代码 背景说明 感觉微信公众号算得是比较难爬 ...
最新文章
- Android Rect 的使用以及与RectF的区别
- Java中date和calendar的用法
- 营销型网站优化攻略分享
- Codeforces Round #327 (Div. 2) B Rebranding
- java scanner类int_Java之 Scanner类
- 企业版Java EE正式易主 甲骨文再次放手
- poj3714 最近点对
- BOM之navigator对象和用户代理检测
- 计算机英语六级,英语六级作文范文:计算机
- netty中的websocket
- JVM常见的七种垃圾收集器的简单比较
- 效率工具Focus for Mac,阻止应用弹窗,集中注意力
- 编译Notepad2语法高亮记事本源码心得
- python之手机号码的验证查询
- 如何用甘特图进行项目进度管理
- 数字金额转换成中文大写金额的函数
- 千锋锋云智慧联合百度重磅打造人工智能产业学院建设方案
- 桌面图标拖不动怎么办?
- 游戏 - PS4 海绵宝宝: 争霸比基尼海滩重注版
- Android 项目接入网易云信IM单聊,群聊