作为一个多年的微信公众号作者,了解微信公众号文章打分的机制是十分有必要的。微信在后台其实有一整套的打分机制,今天基于腾讯的这篇Paper《Cognitive Representation Learning of Self-Media Online Ariticle Quality》为大家介绍下文章质量打分背后的算法理论。

在这篇paper中其实重点分享了两个方面,一方面是文章质量分的深度学习模型设计方法,另一方面是训练数据的构造法。

1 文章质量分模型架构设计方法

整个模型的设计分为两层,第一层是蓝、粉、绿这三个模块,作为基础的文章质量embedding生成层。第二层是最上方的FC Layer全连接层,这一层主要是做评分。

论文里把上面这个网络架构叫做CoQAN,文章质量分的训练模式被当成了二分类问题。

在模型设计上分为三个独立的模块(Subnetwork),分别是:

  • Layout Organization Subnetwork:布局结构判断网络,用来生成布局相关的评分

  • Writing Characteristics Subnetwork:协作风格判断网络,用来评估文章的写作风格

  • Text Semantics Subnetwork:语意深度判断网络,用来评估文章内容的质量

(1)Layout Organization Subnetwork

在布局评估网络中,主要通过循环网络算法GRU去判断图片、文本、视频的布局结构。

每段文章或者视频或者图片叫做一个block,GRU算法用来表述上下block结构pattern,用CNN表述block内部的布局。然后GRU和CNN综合起来

(2)Writing Characteristics Subnetwork

这个网络主要解决的是如何评估文章的协作风格,更多的是NLP方面的一些特征的挖掘,比如标题长度、核心词的个数、文章长度、n-gram、图片和文章的比例、图片数量、文章数量等。

然后利用one-hot编码就可以得到原始特征,然后还可以用一些特征交叉去生成一些交叉特征。

(3)Text Semantics Subnetwork

语意理解模型,通过优化bert模型形成hi-bert模型。hi-bert模型可以挖掘句子和词之间语意关系,找到主题和文章的语意深度。

2 文章质量分模型训练数据

上文介绍了文章评分模型的结构,在Paper的结尾片段还介绍了训练数据的构建方式。文章质量分训练可以看作是一个二分类问题,所以需要选择正样本和负样本。

正样本的标准是高等级的账号发表,具备比较高的喜欢、分享次数,不符合标准的被作为负样本。最终Paper中的模型训练使用了22054篇文章作为正样本,16194篇文章作为负样本。

最终在与其它文章质量分模型的比较中,CoQAN取得了比较好的结果:

微信公众号文章质量评分算法详解相关推荐

  1. 微信公众平台菜单编辑php,如何使用Vue.js实现微信公众号菜单编辑器(思路详解)...

    这次给大家带来如何使用Vue.js实现微信公众号菜单编辑器(思路详解),使用Vue.js实现微信公众号菜单编辑器的注意事项有哪些,下面就是实战案例,一起来看一下. 学习一段时间Vue.js,于是想尝试 ...

  2. 微信公众号登录密码参数加密详解

    微信公众号登录密码pwd参数加密详解 前言 此参数的加密没有任何难度,适合小白练手学习. 网址:https://mp.weixin.qq.com/ 一.打开浏览器开始抓包 输入错误的账号密码,登录.然 ...

  3. 微信登录(微信公众号授权)的开发(详解)

    1.UnionId和OpenId 微信登录最重要的两个返回信息,一个是UnionId,一个是OpenId.两者之间有着必然的联系. 首先,先来理一下微信开放平台的架构.开发微信登录,必须有一个开放平台 ...

  4. 微信登录 sdk 服务器,微信登录(微信公众号授权)的开发(详解)——两三行代码的事,何必呢...

    新版重构的SDK已经开始在写了,具体的使用方法参考 新版重构的SDK已经开始在写了,具体的使用方法参考 新版重构的SDK已经开始在写了,具体的使用方法参考 新版重构的SDK已经开始在写了,具体的使用方 ...

  5. 微信公众号回调地址设置(实战详解)

    操作步骤如下: 1.登录微信公众平台微信公众平台 2.设置与开发->基本配置 参数说明: 服务器地址(URL):编辑好服务器配置后,点击保存,微信会对这个地址发送请求验证,验证通过后才能保存成功 ...

  6. python下载微信公众号文章_python如何导出微信公众号文章方法详解

    1.安装wkhtmltopdf 下载地址:https://wkhtmltopdf.org/downloads.html 我测试用的是windows的,下载安装后结果如下 2 编写python 代码导出 ...

  7. python 公众号文章发布_python如何导出微信公众号文章方法详解

    1.安装wkhtmltopdf 下载地址:https://wkhtmltopdf.org/downloads.html 我测试用的是windows的,下载安装后结果如下 2 编写python 代码导出 ...

  8. 微信公众号文章搜索接口9大详解

    微信公众号作为一个重要的自媒体平台,越来越受到人们的关注.而对于那些想要提高自己公众号文章点击率的人来说,微信公众号文章搜索接口是一个不可或缺的工具.本文将从以下9个方面详细介绍微信公众号文章搜索接口 ...

  9. Python 爬取微信公众号文章和评论 (有源码)

    关注我,一个仍存梦想的屌丝程序员,每天为你分享高质量编程博客. follow us for dream 关注我回复 "微信爬虫" 获取源代码 背景说明 感觉微信公众号算得是比较难爬 ...

最新文章

  1. Android Rect 的使用以及与RectF的区别
  2. Java中date和calendar的用法
  3. 营销型网站优化攻略分享
  4. Codeforces Round #327 (Div. 2) B Rebranding
  5. java scanner类int_Java之 Scanner类
  6. 企业版Java EE正式易主 甲骨文再次放手
  7. poj3714 最近点对
  8. BOM之navigator对象和用户代理检测
  9. 计算机英语六级,英语六级作文范文:计算机
  10. netty中的websocket
  11. JVM常见的七种垃圾收集器的简单比较
  12. 效率工具Focus for Mac,阻止应用弹窗,集中注意力
  13. 编译Notepad2语法高亮记事本源码心得
  14. python之手机号码的验证查询
  15. 如何用甘特图进行项目进度管理
  16. 数字金额转换成中文大写金额的函数
  17. 千锋锋云智慧联合百度重磅打造人工智能产业学院建设方案
  18. 桌面图标拖不动怎么办?
  19. 游戏 - PS4 海绵宝宝: 争霸比基尼海滩重注版
  20. Android 项目接入网易云信IM单聊,群聊

热门文章

  1. matlab绘图标题含有n=变量的方法(类似c语言)
  2. 几个关于财报的基本知识
  3. php微信公众号获取天气预报,【微信公众平台开发】封装获取天气预报功能
  4. Linux路由与策略路由配置
  5. 单行子查询 多行子查询 关联子查询 笔记
  6. 文件服务器 双机,文件服务器双机备份
  7. 浙江树人学院计算机专业好吗,浙江树人学院有哪些专业及什么专业好
  8. LINUX检测服务并自动运行,一种Linux下的开机自动检测硬件信息的方法与流程
  9. think PHP全栈开发教程,【Thinkphp教程】模板中使用函数
  10. Qt多线程中的信号与槽