北语在SemEval 2022释义建模任务上斩获佳绩
每天给你送来NLP技术干货!
近日,第十六届国际语义评测比赛(International Workshop on Semantic Evaluation, SemEval 2022)落下了帷幕。由北京语言大学信科院杨天麟老师、杨尔弘老师和北京交通大学计算机与信息技术学院黄雅平老师带领的参赛队伍(团队名:BLCU-ICALL,团队成员:孔存良、王誉杰、崇瑞宁、张恒源)在Task1:CODWOE - Comparing Dictionaries and Word Embeddings(比较词典与词向量),释义建模子任务上斩获佳绩。在比赛设置的五种语言(EN, ES, FR, IT, RU)中,分别取得了第一(IT),第二(ES,RU)和第三(EN,FR)的名次。
https://competitions.codalab.org/competitions/34022
比赛介绍
SemEval是全球范围内影响力最强、规模最大、参赛人数最多的语义评测竞赛,由国际计算语言学协会(Association for Computational Linguistics, ACL)下属的SIGLEX主办。ACL作为世界上影响力最大、最具活力的国际学术组织,其举办的计算语言学年会(Annual Meeting of the Association for Computational Linguistics)是国际自然语言处理的顶级会议。
我们的方法
本次比赛中,由于限制了预训练模型和额外数据的使用,针对输入信息匮乏的情况,我们设计了基于交叉注意力机制的多任务框架CAMF (Cross-Attention Multitasking Framework)。该框架主要包括以下特点:
框架融合了比赛提供的不同类型的语义向量,并且可以动态调整每个向量的权重。这样,模型可以结合更加丰富的语义信息,逐词生成出最终的释义。
框架使用遮罩语言模型(MLM,Masking Language Model)联合建模释义信息,使得模型可以生成更加流畅、准确的释义。
通过集成学习(Ensemble Learning)来融合多个模型,相比于单一模型鲁棒性更强,效果更好。
我们的模型在效果上较比赛方提供的基线模型有较大提升。
关于我们(BLCU-ICALL)
北京语言大学语言监测与智能学习组(BLCU-ICALL),隶属于信息科学学院,依托国家语言资源监测与研究平面媒体中心和语言资源高精尖创新中心开展科学研究。学术带头人为杨尔弘教授,核心骨干为岳岩副教授和杨天麟副教授。
我组致力于智能辅助语言学习和语言监测研究,以语料库语言学、计算语言学和人文计算等为学科基础,瞄准智能语言学习若干前沿问题,探索辅助汉语学习的理论、方法、技术;以大规模动态流通语料库为基础,探索动态语言知识更新。
编辑:崇瑞宁、孔存良、王梦焰
下载一:中文版!学习TensorFlow、PyTorch、机器学习、深度学习和数据结构五件套! 后台回复【五件套】
下载二:南大模式识别PPT 后台回复【南大模式识别】
投稿或交流学习,备注:昵称-学校(公司)-方向,进入DL&NLP交流群。
方向有很多:机器学习、深度学习,python,情感分析、意见挖掘、句法分析、机器翻译、人机对话、知识图谱、语音识别等。
记得备注呦
整理不易,还望给个在看!
北语在SemEval 2022释义建模任务上斩获佳绩相关推荐
- 北语、北外2022年12月公派英语统考的通知
近日,北语和北外均发布了12月29日国家公派英语高级班结业统考的通知.与以往不同的是:为无法参加12月29日统考的学员增加一次考试机会,时间定于2023年2月25日,但需要提前报名.具体报名时间及方式 ...
- 狼叔直播 Reaction《学习指北:Node.js 2022 全解析》
大家好,我是若川.持续组织了6个月源码共读活动,感兴趣的可以点此加我微信 ruochuan02 参与,每周大家一起学习200行左右的源码,共同进步.同时极力推荐订阅我写的<学习源码整体架构系列& ...
- 北语计算机应用基础2,北语17春《计算机应用基础》练习2
北语17春<计算机应用基础>练习2 (4页) 本资源提供全文预览,点击全文预览即可全文预览,如果喜欢文档就下载吧,查找使用更方便哦! 14.90 积分 2017秋北语17春<计算机应 ...
- 14春计算机基础作业2,北语14春《计算机基础》作业2 答案.docx
北语14春<计算机基础>作业2 答案 作业名称:14春<计算机基础>作业2??出?卷?人:SA作业总分:100??通过分数:60起止时间:2014-6-4 21:15:34 至 ...
- 计算机应用基础作业北语,北语计算机应用基础作业.doc
北语计算机应用基础作业 作业名称:14秋<计算机应用基础>作业2??出?卷?人:SA作业总分:100??通过分数:60起止时间: 2015-1-25 19:11:32 至 2015-1-2 ...
- 2022 数学建模C题 高教社杯 含半成品论文 部分代码 全部数学模型 和全套思路
2022 数学建模国赛B题 高教社杯 含半成品论文 部分代码 全部数学模型 和全套思路 定时更新!! 全部内容见:https://mianbaoduo.com/o/bread/mbd-Y5WUkpps ...
- 安徽赛区2022数学建模国赛获奖名单
安徽赛区2022数学建模国赛获奖名单如下: 本科生组 专科生组
- 【上海赛区】2022数学建模国赛获奖名单公布
2022数学建模国赛上海赛区获奖名单新鲜出炉!
- 微型计算机出现在20世纪,北语网院20秋《计算机基础》作业【标准答案】
可做奥鹏全部院校作业论文!答案请添加qq:599792222 或 微信:1095258436 20秋<计算机基础>作业 1.[单选题] 电子计算机最重要的特征是( ). A.高速度 B.高 ...
- 北语信息院院长荀恩东:语言智能的核心是语义理解丨CCF-GAIR 2020
2020-08-09 01:24:03 作者 | 青暮 编辑 | 丛末 2020 年8 月7日-8月9日,在中国深圳,由中国计算机学会(CCF)主办,香港中文大学(深圳).雷锋网联合承办,鹏城实验室. ...
最新文章
- 计算机书籍-前谷歌工程师撰写-机器学习实战
- 机器学习、深度学习、强化学习课程超级大列表!
- Oracle 11gR2 GI日常管理手册
- QPW 点评表(tf_appraise)
- SharePoint 2013 List 备份使用
- usb hid 调试软件_开源USB免驱固件升级软件分享
- 各种主流Linux操作系统概况
- Java日历打印_使用java 打印日历
- CVPR 2019 | 腾讯AI:做好活体检测,模型重要,数据亦然
- java中aop和aoc的区别_AOC与AOP的区别
- 天猫搜索前端架构演进之路
- 天天果园成为Zespri 佳沛奇异果直接经销商
- 使用python打印九九乘法表
- 计算机软件资格入户,考信息系统项目管理师证书是不是可以申请入户
- flash 批量编译发布fla 文件
- 身份证实名认证-身份实名认证-身份证核验
- 爬虫开发02--数据解析--xpath(首选)
- 使用反应路由器V4以编程方式导航
- vue+photo-sphere-viewer 渲染全景图片,带给你沉浸式体验
- 2022年施工员-装饰方向-通用基础(施工员)考试题库及施工员-装饰方向-通用基础(施工员)证考试
热门文章
- 提供 web前端、H5、html页面 技术服务
- 数据库表可以没有外键
- PAT A1053 Path of Equal Weight [树的DFS遍历]
- ubuntu查看本地ip
- Jzoj5662 尺树寸泓
- spring整合大全
- 新商业模式 私下销售 Private Sales Gilt Groupe年营收1.5亿
- Winform--处理MDI父窗体与子窗体的交互
- C++数据类型之结构体的练习(用到结构体的赋值,利用结构体元素排序以及查找)
- java day60【 Spring 中的 JdbcTemplate[会用] 、Spring 中的事务控制 、Spring5 的新特性[了解] 】...