BERT+CRF+pytorch

先给出模型结构图:

https://blog.csdn.net/HUSTHY/article/details/109276404

BERT + CRF损失函数的计算

# CRF的损失函数计算
    def loss_fn(self, bert_encode, output_mask, tags):
        loss = self.crf.negative_log_loss(bert_encode, output_mask, tags)
        return loss

注意重要的是计算损失函数的方式,不是简单的CrossEntropy,而是对CRF的发射矩阵进行训练与计算,CRF的定义如下:

import torch
import torch.nn as nn
from torch.autograd import Variable

class CRF(nn.Module):
    """线性条件随机场"""
    def __init__(self, num_tag, use_cuda=False):

https://blog.csdn.net/lcomecon/article/details/108728880

中文NER任务简析与深度算法模型总结和实战展示 转 作者原创的不错,很有水平,需要研读相关推荐

  1. 中文NER任务简析与深度算法模型总结和实战展示

    目录 一.中文NER定义 1.什么是NER 2.怎么来完成NER 3.NER标注体系 二.基于pytoch和TensorFlow的深度学习算法NER实战 1.算法概览 2.算法实战 A.BiLstm+ ...

  2. 简析穷举算法,及其简单应用

    简析穷举算法,及其简单应用 穷举概述 穷举法又称列举法,其基本思想是逐一列举问题所涉及的所有情况. 穷举法常用于解决"是否存在"或"有多少种可能"等问题. 应用 ...

  3. 简析王者荣耀的匹配机制

    本文以王者荣耀为主体,结合多款MOBA类游戏,对其匹配机制进行的一些猜想, 1.匹配机制的基础 分别从why.who.how三个角度简析. 1.1Why 王者荣耀有实战对抗模式,娱乐模式,排位赛模式等 ...

  4. 中文NER涨点神器!基于多元数据的双流Transformer编码模型

    ©PaperWeekly 原创 · 作者 | 宁金忠 学校 | 大连理工大学博士生 研究方向 | 信息抽取 本篇论文发表于 ACL 2021,作者聚焦于中文 NER 任务.近些年来,在模型中引入词汇信 ...

  5. Linux内核引导简析

    bootsect.S.setup.S.head.S分析 收藏 2010-01-14 13:36:34 bootsect.S,系统引导程序,一般不超过512字节. 在PC系统结构中,线性地址0xA000 ...

  6. 卡尔卡西25首练习曲简析-音阶与音程训练

    卡尔卡西于1792年出生于意大利佛罗伦萨,中年定居巴黎而于1853年去世,其吉他活动活跃于整个欧洲.他是吉他史上第一黄金期(也就是吉他的复古与古典时期)的重要人物之一,与朱里亚尼和卡路里并称为意大利三 ...

  7. 机器如何“猜你喜欢”?深度学习模型在1688的应用实践

    一.背景 猜你喜欢是推荐领域极其经典的一个场景,在1688首页无线端猜你喜欢栏目日曝光约23w,其中约72%的用户会产生点击行为,人均点击约8次.在我们的场景中,这部分是一个相对较大的流量来源.我们算 ...

  8. 如何画出漂亮的深度学习模型图?

    最近作报告时画图感觉画的不太美观,刚刚发现了一个不错的素材方便画深度学习模型图. 在Github上找到了一个不错的内容.作者介绍了有个ML visual的利器,提供一份32页的PPT模型图素材,可以直 ...

  9. 目标检测算法模型YOLOV3原理及其实战 课程简介

    前言 在移植目标检测算法模型到海思AI引擎上运行的过程中,深切感受到理解和掌握算法模型原理的重要性. 基于此,我出了一门专门来讲目标检测算法模型原理及实战的课程.虽然讲的是YOLOV3模型,但是对理解 ...

最新文章

  1. git上的分支命名规范
  2. nyoj42一笔画问题
  3. debian mysql开机启动_自动启动debian和lighttpd+mysql
  4. boost::log::settings用法的测试程序
  5. JS原型、原型链深入理解
  6. HDU3400(计算几何中的三分法利用)
  7. appium定位元素java篇【转】
  8. Android 系统(230)---OTA 软件包工具
  9. acs880变频器静态辨识_ACS880变频器PID控制参数设置
  10. 常用的控件样式风格设置(qss)——QtWidgets
  11. MySQL第七章之后的
  12. 牛客网——Java刷题篇
  13. 超微服务器只显示raid0,超微主板怎么创建RAID磁盘阵列 服务器组建RAID0、RAID1图文教程...
  14. 免费常用IP归属地查询API
  15. ASC18世界超算大赛的三大变化与一大不变丨Xtecher观察
  16. android 客户端 和 新浪微博如何打通的
  17. .xyz让域名应用充满艺术感
  18. typedef 的用法
  19. 流量为王:ABTest流量分层分桶机制
  20. 机制分析:基于简易的时间片轮转多道程序的 linux 内核

热门文章

  1. spring mvc基本概念
  2. 哇塞,可以使用PyTorch实现目标检测与跟踪,这不有趣多了
  3. 用c语言编写通讯录程序,学C三个月了,学了文件,用C语言写了个通讯录程序
  4. linux密码加密文件,Linux下加密/解密及用密码保护文件的七把利器
  5. 引号快捷键_干货收藏|excel2016常用快捷键
  6. 自动回复_小程序消息自动回复
  7. canvas贝塞尔曲线爱心_canvas实现高阶贝塞尔曲线(N阶贝塞尔曲线生成器)
  8. linux awk语法格式,Awk是什么?一文带运维小白快速掌握Linux Awk用法
  9. matlab sisotool工具箱实例,MATLAB工具箱Sisotool工具箱在控制系统补偿器中的应用
  10. 将一维数组的值逆序输出