目的之类的就不用说了,直接说pcnn做实体关系抽取的过程:

1、把输入转换成对应的向量:

  1. 上面的输入是 I hired Kojo Annan,the son of Kofi Annan,in the company;
  2. 两个实体我用红体标出来了;
  3. 转换的向量实际上包含两部分,一是这个词经过训练好的矩阵looking up得到的向量,假设是d维;二是位置向量;
  4. 假设hired这个字吧,离实体的距离分别是-1和-6,son距离两个实体的距离分别是3和-2,然后呢,随机初始化位置矩阵,再相乘得到的就是位置向量,显然位置向量有两个,毕竟有两个距离,假设每个是p维;那么这个字的向量维度就是d = d1+p*2。上面图中一共是6维,那么输入就是12*6.因为这个句子中一共有12个字,也就是sequence_length(包含了标点),相当于输入是sequence_length ×(d1+p*2)

2、卷积:

  1. 把上面的输入当做S,每个字的向量是q(i),每个维度是d;
  2. 卷积操作实际上就是一个权重矩阵w,嗯就是这样的哈哈,这个W是(w*d),w是滤波器的长度,这个长度是干嘛的我们后面说,这里假设w=3;
  3. 论文这里提出来一个新的概念,就是q(i:j),指的的q(i)和q(j)的串联,具体来说就是把第i的字的向量到第j个字的向量整合到一起,按道理来说这里做处理可以得到字之间潜在的关系。这里i和j之间的长度就是w,下面细说;
  4. 看个论文中的公式:c(j) = w q ( j-w+1 : j );
  5. 这里是点乘,所以c(j) 的维度就是1,j的取值区间是1到s+w-1,s就是sequence_length ,so向量C的维度很明显了就是s+w-1;
  6. j = 1时,c(1) = w q ( -1 : 1 )哈?q是从1开始的呀,没有-1呀,这个时候就是index超出输入S的范围,补0就好了,q(-1)和q(0)各补6个0就好了(因为我们上面说过每个字的输入维度是6),这样q ( -1 : 1 )的维度就是18(w*d=3*6),滤波器矩阵(权重矩阵)的维度也是18(w*d=3*6),嗯就是这样,这样就得到上图中convolution层中的绿色那一列;
  7. 但convolution层中有三列呀?!那就多设置几个w就好了,这个时候整个大的W = {w1, w2, w3, ...... wn};
  8. 这样就可以得到n列的c了,这个时候C的维度就是n×(s-w-1)

3、piece Max Pooling

  1. 字面意思就是最大值池化,和图像中的处理类似,但这里会损失到很多的信息,因为是从几个值中取最大值,其余的全部抛弃,但很多论文中说取了最大特征(即保留了最大值),虽然我并不认同。论文中做了一个处理就是把一个句子根据两个实体的位置分成三个部分(所以论文叫piecewise);
  2. 然后呢,然后呢,取每个部分的最大值,(哈哈哈哈哈哈哈哈,我服了),具体过程就是convolution我们不是得到的C矩阵是n×(s-w-1),即n个列向量,每个维度是 s-w-1 ;把每个s-w-1分成三部分,取每部分的最大值,那么每个s-w-1向量经过pooling之后都会变成3维;
  3. 所以经过整个pooling之后再拼接就是一个1 × (3*n)向量
  4. g = tanh(C)

4、全连接输出

    o = W1 (g & r) + b&符号是我随意写的,实际就是点乘;

    很明显吧,这不就是一般网络最后一层嘛,全连接层,但本论文对倒数第二层做了dropout,具体操作就是加了个伯努利随机      初始化的矩阵,值的范围0到1,然后与g点乘,论文叫masking操作。(这一部分最后论文写了几句话,在测试时,学习得到      的权重矩阵W1按比例放大W1 = p * W1,dropout = 1,然后用来计算未出现过的实例的得分????)

5、多实例学习

    目的:为了缓解错误标签问题提出的这一部分。

    1、参数θ = (E,PF1, PF2, W, W1) E是字向量,PF是位置向量,其余两个就是要学习得到的矩阵

    2、有T个tags,每个tag(M(i))里面有q个实例,其中一个实例就是m(ij),表示第i个tag的第j个实例

    3、输出o中的第r个元素就是关系r的可能性

    4、3中提到的可能性的计算就是归一化

                                                     

    5、multi-instance learning的目的是discriminate bags而不是instances。计算每个bag水平上的交叉熵。

         整个过程如下图:

                                           

         最大化J就好了,具体过程你们自己理解吧哈哈哈哈哈,吃东西去了!!!!

pcnn关系抽取论文阅读总结:尽量细节表现出来相关推荐

  1. 关系抽取论文整理,核方法、远程监督的重点都在这里

    来源 | CSDN 博客 作者 | Matt_sh,编辑 | Carol 来源 | CSDN云计算(ID:CSDNcloud) 本文是个人阅读文章的笔记整理,没有涉及到深度学习在关系抽取中的应用. 笔 ...

  2. 关系抽取论文整理——早期文献

    说明 本文是个人阅读文章的笔记整理,没有涉及到深度学习在关系抽取中的应用. 笔记中一部分来自个人解读,一部分来自原文,一部分来自网上摘录.[由于文章是分开做笔记,很多参考链接没有及时保留,还请谅解.如 ...

  3. 关系抽取论文总结(relation extraction)不断更新

    2000 1.Miller, Scott, et al. "A novel use of statistical parsing to extract information from te ...

  4. SSAN 关系抽取 论文笔记

    20210621 https://zhuanlan.zhihu.com/p/353183322 [KG笔记]八.文档级(Document Level)关系抽取任务 共指id嵌入一样 但是实体嵌入的时候 ...

  5. EMNLP2021 | DeepBlueAI团队少量数据关系抽取论文被录用

    近日,EMNLP 2021在官网提前公布了今年的论文审稿结果,DeepBlueAI团队的论文<MapRE: An Effective Semantic Mapping Approach for ...

  6. 关键字抽取论文阅读笔记

    刘知远老师博士论文-基于文档主题结构的关键词抽取方法研究 一.研究背景和论文工作介绍 关键词抽取分为两步:选取候选关键词和从候选集合中推荐关键词. 1.1. 选取候选关键词 关键词:单个词或者多个单词 ...

  7. 远程监督关系抽取漫谈:结合知识图谱和图神经网络

    远程监督关系抽取是一种用知识图谱去对齐朴素文本的标注方法,属于半监督学习算法,自然而然提取特征的时候就会出现很多噪声.比如两个实体之间还有别的关系或者是没有关系,这样的训练数据会对关系抽取器产生影响. ...

  8. 深度学习实体关系抽取研究综述笔记

    鄂海红,张文静,肖思琪,程瑞,胡莺夕,周筱松,牛佩晴.深度学习实体关系抽取研究综述.软件学报,2019,30(6): 1793−1818. http://www.jos.org.cn/1000-982 ...

  9. 入门文档级关系抽取_数据集DocRED、CDR、GDA

    作为学习文档级关系抽取的短暂总结与记录.主要是相关数据集问题,如果能帮助到其他人,我也是很开心的. 文档级关系抽取论文 网上有很多文档级关系抽取的综述,他们会告诉你有哪些经典文献需要阅读,我就不再搬运 ...

  10. 3种基于深度学习的有监督关系抽取方法

    摘要:本文对几种基于深度学习的有监督关系抽取方法进行了介绍,包括CNN关系抽取.BiLSTM关系抽取以及BERT关系抽取. 本文分享自华为云社区<基于深度学习的有监督关系抽取方法简介>,作 ...

最新文章

  1. Python3模块Crypto改为pycryptodome
  2. 自动化监控--添加itme的web页面详解
  3. C++多线程快速入门(五)简单线程池设计
  4. Windows系统进程介绍
  5. 前端开发人员需知——浏览器详解
  6. 来自DFRobot的中文语音识别模块
  7. CentOS搭建SVN记录
  8. 获取Excel数据及Sheet的方法
  9. Dynamics 365 Online-Unified User Interface
  10. (转)战斗bug技巧全攻略
  11. 机器视觉科学计算可视化_模因视觉:对模因进行分类的科学
  12. centos6.5命令行 安装锐起 RDV(Rich Desktop Virtualization)
  13. 算法与数据结构——有序表(Java)(b站左程云课程笔记总结)
  14. 管家婆单机版_安稳之托 祝福管家婆软件25周年
  15. 爬取《NBA30支球队》“现役球员信息”,分别存储到3种不同的数据库!
  16. png 微软ppt 透明度_完美PNG半透明窗体解决方案
  17. [flinkSQL] 开滚动窗口 求不同地区退款率 top-N
  18. 在openSUSE上编译aMule-DLP
  19. TABLE 的css的样式表
  20. 客户案例 | 高等教育出版社

热门文章

  1. 新手初识安信可ESP8266 12f机智云开发板微信直连云
  2. 石油化工行业的MES系统解决方案
  3. axure6.5汉化最新正式破解版本下载(有注册码)
  4. 三种方式实现Java对象转json下划线格式
  5. Mac After Effects安装BodyMovin说明文档
  6. 阿里巴巴-码出高效+阿里巴巴Java开发手册(华山版)PDF下载
  7. GooFlow修改元素color(背景/字体/连线)
  8. 电脑连接Wifi,只能上QQ不能上网。关键字:无Internet访问权限。
  9. 2022年最新西藏机动车签字授权人模拟考试及答案
  10. 台达DVP50MC11T与威纶触摸屏ModbusTCP通信