文章目录

  • Why SemEval?
  • Introduce of SemEval
    • 补充
  • References

SemEval (Semantic Evaluation) 是评估机器语义分析的一个系列,或者说是一系列研讨会。该研讨会每年都会举办一次,目前依旧存在。

Why SemEval?

在具体介绍 SemEval 之前,我们先弄清楚为什么要举办这样的一个研讨会。我们知道 NLP 是一个很有难度的领域,这一领域的终极目标即可以让机器像人一样理解、处理语言,而想做到这一点需要让机器弄明白语言的意思(meaning),也即 Semantics 。那么每年技术都有进步,我们距离最终的目标还有多远呢?为了了解当前机器的水平,合理、有效的评估就很重要了,这也是 SemEval 要做的事。

Introduce of SemEval

现在我们知道 SemEval 研讨会是为了评估语义,那么如何有效的评估呢?SemEval 是如何做的呢?其实既然是评估机器的能力(和人类的差距),那么比较自然的想法就是让机器和人做同一件事,然后基于此评估。有了大致思路,下面给出 SemEval 评估的流程:

图1(源自维基百科)

  1. 其实最开始一步在图中没有体现,因为我们知道语义这个词还是很宽泛的,毕竟人类在不同情景下理解语义的方式也不同(或者说侧重点不同,比如在看弹幕时我们优先想“梗”,而在女朋友生气时我们优先思考女友语言的“反义”,等等),可以说在很长一段时间里机器都没办法统一的处理所有情况(理解语义)。

    基于上述,可知要想评估需要先给定任务,所以 SemEval 第一步工作即设置任务。

  2. 构造人工标注的数据集。

  3. 机器在相应数据集完成任务。机器处理的方案由许多人员或团队提出。

  4. 最后根据各个方案得到的结果评分以及估计 SOTA (state of the art)。

补充

SemEval 每年的任务和方案其实各自都可以看作是一个比赛,由报名参赛的人员或团队提供。(任务是近年才采用这种形式的)。

References

  • [1] 维基百科 SemEval
  • [2] SemEval: International Workshop on Semantic Evaluation

SemEval 介绍相关推荐

  1. SemEval 情感分析主流数据集以及任务介绍

    SemEval 的发展: SemEval 数据集完成基本任务是推特的情感分析(Sentiment Analysis in Twitter).对于推特的文本情感分析基于SemEval 数据集始于2013 ...

  2. 【关键词提取】第二篇:数据集、实现代码介绍

    原文地址:http://www.cnblogs.com/lessmore/category/1009890.html 转载请保留本行,欢迎交流. 目录: 第一篇:综述 第二篇:数据集.实现代码介绍 第 ...

  3. 信息抽取数据集和相关SOTA介绍

    一.概览 模型 NYT*/NYT WebNLG*/WebNLG ACE ACE05 ACE04 SciERC TPLinker 91.9/92.0 91.9/86.7 TPLinkerPlus:htt ...

  4. 简单介绍互联网领域选择与营销方法

    在我看来,互联网领域的选择是"安家",而营销方法的不同则表现了"定家"的方式多种多样,只有选对了,"家"才得以"安定". ...

  5. 常用开源协议介绍以及开源软件规范列表

    1. 开源协议介绍 GPL: General Public License,开源项目最常用的许可证,衍生代码的分发需开源并且也要遵守此协议.该协议也有很多变种,不同变种要求会略微不同. MPL: MP ...

  6. python:Json模块dumps、loads、dump、load介绍

    20210831 https://www.cnblogs.com/bigtreei/p/10466518.html json dump dumps 区别 python:Json模块dumps.load ...

  7. pytorch学习笔记(九):PyTorch结构介绍

    PyTorch结构介绍 对PyTorch架构的粗浅理解,不能保证完全正确,但是希望可以从更高层次上对PyTorch上有个整体把握.水平有限,如有错误,欢迎指错,谢谢! 几个重要的类型 和数值相关的 T ...

  8. Python字节码介绍

    了解 Python 字节码是什么,Python 如何使用它来执行你的代码,以及知道它是如何帮到你的. 如果你曾经编写过 Python,或者只是使用过 Python,你或许经常会看到 Python 源代 ...

  9. Pytest - 使用介绍

    1. 概述 pytest是一个非常成熟的全功能的Python测试框架,主要特点有以下几点: 1.简单灵活,容易上手,文档丰富: 2.支持参数化,可以细粒度地控制要测试的测试用例: 3.能够支持简单的单 ...

最新文章

  1. linux文件 i节点结构,Linux 文件描述符 文件表项 i节点结构
  2. SpringBoot非官方教程 | 第八篇:SpringBoot整合mongodb
  3. 关于HTML页以Get方法向asp.net页面传值乱码的解决
  4. 【MATLAB】数据类型 ( 执行代码 | 清空命令 | 注释 | 数字 | 字符 | 字符串 )
  5. Jmeter_前端RSA加密下的登陆模拟_引用js文件实现(转)
  6. 你的 Docker 应用是安全的吗?
  7. 第六章实验报告(函数和宏定义实验)
  8. YY:马化腾的大漏招
  9. c字符串中包含双引号_零基础学Python:一文看懂数字和字符串
  10. 大数据之-Hadoop3.x_MapReduce_ReduceTask工作机制并行度---大数据之hadoop3.x工作笔记0125
  11. case when then 统计去重数据_数据分析--SQL求职面试题
  12. java 分隔函数split(,-1)的用途
  13. 推荐一款UI非常Good的 Redis 客户端工具
  14. NSIS 安装打包安装程序
  15. 安卓逆向 -- JEB3.7安装使用
  16. 计算机频繁启动是何原因,电脑开机频繁断电又重启怎么回事?
  17. 检测本地连接并自动连接宽带连接.cmd
  18. 手机中的劳力士:HTC是执迷不悟还是不悔?
  19. 弘玑Cyclone代表中国RPA进入Gartner魔力象限:迄今国内厂商最佳排名,迈入全球一线阵营
  20. 03系统多界面_资讯:苹果公布iPhone 12屏幕更换价格;华为 Mate 40 Pro 系统界面截屏曝光;Redmi K30S 更多细节曝光...

热门文章

  1. 【Canvas】字体图标二、 Iconfont-阿里巴巴 、矢量图标库
  2. 阿里云oss文件处理工具类
  3. 人应该在早年播下成功的种子
  4. 《程序员》05期上市,下一代互联网竞争格局
  5. 《惢客创业日记》2021.02.22(周一)只能“抱大腿”
  6. js对当前表格各列数据的求和
  7. BuChain 介绍:视屏讲解
  8. cmd正则表达式批量重命名
  9. java屠龙_Java中的屠龙之术——如何修改语法树
  10. 5年了,高通还是那个高通,华为却早已不是当年的华为!