·阅读摘要:
  本文在《Improved Neural Network-based Multi-label Classification
with Better Initialization Leveraging Label Co-occurrence》文章的基础上,提出了对具有层级结构的多标签进行多分类。
  [1] Initializing neural networks for hierarchical multi-label text classification

阅读前提

  在阅读本篇论文之前,务必阅读《Improved Neural Network-based Multi-label Classification
with Better Initialization Leveraging Label Co-occurrence》,因为本篇论文是基础此篇论文的小小改进。

  《Improved Neural Network-based Multi-label Classification
with Better Initialization Leveraging Label Co-occurrence》的阅读笔记请参考博客:https://blog.csdn.net/qq_43592352/article/details/122810687

论文核心内容

  1、提出在《Improved Neural Network-based Multi-label Classification
with Better Initialization Leveraging Label Co-occurrence》的模型,在应用于标签共现少的数据集时不适用。反而对具有层级结构的标签的数据集应用的更好。

  2、具有层级结构的标签:

  论文提出的理论是:当一个文本显式地具有某个标签(例如图中的深色的结点)时,那么这个文本一定得隐式地具有该标签的父标签(即图中深色结点一系列的浅色父结点)。

  “显式”表示在数据集中指定了这条文本的标签,“隐式”表示标签具有的父标签在数据集中这条文本上没有指定,但是标签有层级关系,它还是应当有的。

  3、对非标签共现模式的神经元采用:权重随机初始化或者权重零值初始化。

  4、后处理标签校正:

  论文提出,A中标签分配是错误的,一个文本具有z标签后,理应具有它的父标签y、z,但是A中没有,所以要修正。

  论文提出两种修正方法:传递修正(transitive correction)、撤回修正(retractive correction)。

  如图B,使用传递修正(transitive correction),把子类z的所有父级都设置为正标签,即x、y、z设为正标签。

  如图C,使用撤回修正(retractive correction),只把子类z的最终父级都设置为正标签,即x设为正标签。

【多标签文本分类】Initializing neural networks for hierarchical multi-label text classification相关推荐

  1. 【多标签文本分类】HFT-CNN: Learning Hierarchical Category Structure for Multi-label Short Text Categorization

    ·阅读摘要:   本文提出结合基于CNN微调的HFT-CNN模型来解决层级多标签文本分类问题.   [1] HFT-CNN: Learning Hierarchical Category Struct ...

  2. 【多标签文本分类】Ensemble Application of Convolutional and Recurrent Neural Networks for Multi-label Text

    ·阅读摘要:   本文提出基于Seq2Seq模型,提出CNN-RNN模型应用于多标签文本分类.论文表示CNN-RNN模型在大型数据集上表现的效果很好,在小数据集效果不好. ·参考文献:   [1] E ...

  3. 【多标签文本分类】Improved Neural Network-based Multi-label Classification with Better Initialization ……

    ·阅读摘要:   提出了一种新的神经网络初始化方法:利用标签共现初始化最终隐藏层.   [1] Improved Neural Network-based Multi-label Classifica ...

  4. EMNLP 2021 | 多标签文本分类中长尾分布的平衡策略

    点击上方"视学算法",选择加"星标"或"置顶" 重磅干货,第一时间送达 作者 | 黄毅 作者简介:黄毅,本文一作,目前为罗氏集团的数据科学家 ...

  5. 多标签文本分类研究进展概述

    多标签文本分类研究进展概述 1.多标签文本分类的研究还有很大的提升空间. 2.多标签文本分类的基本流程,包括数据集获取.文本预处理.模型训练和预测结果: 3.多标签文本分类的方法:传统机器学习的方法和 ...

  6. 多标签文本分类数据集_标签感知的文档表示用于多标签文本分类(EMNLP 2019)...

    原文: Label-Specific Document Representation for Multi-Label Text Classification(EMNLP 2019) 多标签文本分类 摘要: ...

  7. bert 是单标签还是多标签 的分类_标签感知的文档表示用于多标签文本分类(EMNLP 2019)...

    原文: Label-Specific Document Representation for Multi-Label Text Classification(EMNLP 2019) 多标签文本分类 摘要: ...

  8. bert-textcnn实现多标签文本分类(基于keras+keras-bert构建)

    基于keras+keras-bert构建bert-textcnn模型实现多标签文本分类 跑别人的代码,最痛苦的莫不在于环境有错误.代码含义不懂.自己从头到尾尝试了一遍,过程很艰难,为了方便同样在学习的 ...

  9. 【多标签文本分类】融合CNN-SAM与GAT的多标签文本分类模型

    ·阅读摘要:   在本文中,作者基于CNN.Attention.GAT提出CS-GAT模型,在一些通用数据集上,表现良好. ·参考文献:   [1] 融合CNN-SAM与GAT的多标签文本分类模型   ...

最新文章

  1. 用计算机怎么算个人所得税,个税计算器2021
  2. python 复制dict_超全的Python 字典(Dictionary)介绍
  3. unity and MySql
  4. Java写入磁盘阵列_月光软件站 - 编程文档 - Java - 利用Linux创建磁盘阵列
  5. JS组件系列——Bootstrap Table 表格行拖拽(二:多行拖拽)
  6. 解决idea中xml文件报红问题
  7. Kubernetes 入门教程
  8. GoLang MySQL CRUD Example
  9. 《财富》评2020年最受赞赏中国公司:华为第一 小米第三
  10. 腾讯下一步:关注通用AI,加大投入产业互联网,推出医疗新品AI显微镜
  11. javascript中常用的对象创建方式有哪些?
  12. 在线班课程-第10周 http基础知识、nginx网站服务
  13. Java swing 开发windows桌面应用:课堂点名程序
  14. 艾伦·图灵——如谜的解谜者
  15. 分析5 中值定理与Taylor公式
  16. 使用Selenium实现微博爬虫:预登录、展开全文、翻页
  17. rtmp协议规范详解
  18. 企业邮箱一年多少钱,邮箱注册教程,企业oa平台
  19. 【Python】Python创建虚拟环境的三种方式
  20. 手游SDK-登录界面

热门文章

  1. java Excel 导入 IllegalStateException 异常处理 不同的数据类型
  2. linux 下面数据库备份
  3. pl/sql块的基本语法
  4. 比较两个字符串是否相等
  5. 深入浅出CMake(二): 基础语法
  6. Machine Learning | (5) Scikit-learn的分类器算法-朴素贝叶斯
  7. Linux(64位)下OpenBabel 2.4.1、python2.7和Ipython实战(一)
  8. GGally包绘制的几个图形
  9. 科学通报:合成微生物群落的构建与应用
  10. 【Plant Cell】突破!加入一种酵母,可显著提高水稻氮利用率及产量!