近年来,产学研各界在自然语言处理(NLP)领域持续深耕,促进着人工智能技术不断向前发展。技术的应用不仅改变着人类的生活方式,也为产业升级提供了更多可能。

3月30日,聚焦NLP领域的2022语言与智能技术竞赛正式启动报名。本次竞赛将联手“千言”数据集开源项目,覆盖跨模态、知识驱动、可信学习等人工智能的前沿课题,发布全新四大任务,并发布中文领域首个搜索知识对话数据集、首个面向实际应用场景的中文大规模段落检索数据集等多个重磅数据集。参赛选手将有机会结合技术前沿课题和实际应用场景,进行技术突破和评测挑战,获胜队伍将分享总额超过20万元的奖金。

NLP圈顶级赛事 四大任务再升级

本竞赛由中国中文信息学会(CIPS)和中国计算机学会(CCF)联合主办,百度公司、中国中文信息学会评测工作委员会和中国计算机学会自然语言处理专委会承办,已连续举办4届,成为全球最热门的中文NLP赛事之一。

在2021年的上一届评测中,参赛队伍报名超过3500支,企业队伍占比约20%,覆盖了互联网、通讯、金融、能源、航空航天等多个领域,其中不乏腾讯、华为、阿里巴巴、字节跳动、国家电网、中国移动等知名企业;高校队伍占比约50%,覆盖了清华大学、北京大学、复旦大学、中国人民大学、慕尼黑工业大学、早稻田大学、爱丁堡大学等300多所国内外高校。评测累计收到有效提交结果1万多次,竞争非常激烈。

据了解,2022年竞赛对赛题设置进一步升级,推出四大全新任务:

段落检索——让机器从大规模语料库中找出相关段落,评估机器的语义检索及排序的能力,是自然语言处理和信息检索领域的重要任务,也是搜索引擎核心能力之一,每日帮助用户从超过百亿的网页文档中快速找到结果。本任务将探索最新的稠密段落检索方法,相较于传统字面匹配,能够大幅提升检索系统对查询和候选段落进行语义建模的能力。

知识对话——让系统具备利用搜索引擎知识进行开放域对话交互的能力,提升对话的丰富性与知识准确性。智能音箱、虚拟人、语音助手等对话应用产品已经融入日常生活,但在实际聊天时却经常出现“智商”不足的现象,本次竞赛让机器人学会利用全网知识,为人机对话 “智商在线”的实现提供可能。

情感分析可解释性——让情感分析模型更可解释,从合理性、忠诚性等维度评测模型的可解释性,进而推动构建更加可解释的模型。本次比赛首次提出情感分析的可解释性评测,可解释性是下一代人工智能重点“可信AI”的重要维度,能够针对性缓解神经网络模型“黑盒”特点带来的结果不可信问题,具有非常高的探索价值。

视频语义理解——让机器对视频进行内容分析与理解。在移动互联网、大数据的时代,视频数据呈现爆发式增长。传统基于感知的视频内容分析,缺乏语义理解能力,本赛题提出知识增强的视频语义理解技术评测,期望融合语言、知识、视觉、语音等相关技术和跨模态信息,深入且全面地理解视频语义。

这四大任务赛道不仅覆盖NLP的前沿领域,也反映了真实应用的需求,具有很高的学术和产业价值。

中文NLP领域缺数据?联手千言,首发多个重磅数据集

推动人工智能技术进步的三大驱动力是算法、算力和数据。在这三者中,数据作为算法学习的基础,其数量和质量直接决定了算法能够达到的上限水平,好的语料可以极大推动相关领域的技术发展和行业进步。

而在自然语言处理领域,英文的开源数据集百花齐放;反观中文数据集,存在开源数量少且分散的情况。为了推动中文NLP数据和技术的发展,“千言”开源数据集项目应运而生。

本次语言与智能技术竞赛联手“千言”项目,首次公开多个最新中文数据集:来源于实际应用场景的大规模段落检索数据集DuReader_Retrival、领域开放的搜索知识对话数据集DuSINC、情感分析可解释数据集DuExplain、大规模视频语义理解数据集DuVUnderstanding。这些数据集具有很高的技术价值,将在本次评测期间,免费开放给参赛选手进行技术研究和探索。

另外,为了全力创造最佳竞赛条件,充分激发选手的创新灵感,百度作为本次大赛承办方为参赛选手提供了全面的技术资源和平台支持。其中,百度飞桨平台为四大竞赛任务提供了基线系统,帮助选手快速上手。同时,基于百度飞桨的人工智能学习与实训社区 AI Studio还提供了在线编程环境、免费GPU算力支持,打破算力桎梏,在竞赛全流程为选手斩获佳绩护航。

2022语言与智能技术竞赛将于3月30日正式开启报名通道,欢迎进入“2022语言与智能技术竞赛官网”了解详情、进行报名。

官网链接:http://lic2022.cipsc.org.cn

2022语言与智能技术竞赛启动 全球热门的中文NLP赛事它来了相关推荐

  1. 2021语言与智能技术竞赛上线!百度飞桨提供平台算力支持

    ↑↑↑关注后"星标"Datawhale 每日干货 & 每月组队学习,不错过 Datawhale竞赛 主办方:中国计算机学会.中国中文信息学会 人工智能是让机器像人一样感知和 ...

  2. 信息抽取(一)机器阅读理解——样本数据处理与Baseline模型搭建训练(2020语言与智能技术竞赛)

    机器阅读理解--样本数据处理与Baseline模型搭建训练 前言 样本数据处理 数据测试 模型部分 模型构建 模型训练 部分推理结果 总结 前言 最近看到今年早些时候百度的"2020语言与智 ...

  3. 『2021语言与智能技术竞赛』-多技能对话任务基线系统 Fork 325 喜欢 7

    2021语言与智能技术竞赛:多技能对话 多技能对话系统旨在建立一个开放域的多轮对话系统,能自然地融合多个对话技能,比如知识对话.推荐对话等,使得机器可以流畅自然地与人进行语言交互,从而有效地提升用户体 ...

  4. 2021语言与智能技术竞赛:机器阅读理解任务 实验报告

    2021语言与智能技术竞赛:机器阅读理解任务 --实验报告 1. 比赛介绍 2. 赛题说明 2.1 样例 2.2 数据说明 3. 数据集介绍 3.1 数据介绍 3.2 数据样本 4. 模型介绍 4.1 ...

  5. 『2021语言与智能技术竞赛』-机器阅读理解任务基线系统详解

    阅读理解 DuReaderchecklist 该示例展示了如何使用PaddleNLP快速实现LIC2021机器阅读理解比赛基线并进阶优化基线.机器阅读理解 (Machine Reading Compr ...

  6. 基于百度2020语言与智能技术竞赛:事件抽取任务

    关注微信公众号:NLP分享汇.[喜欢的扫波关注,每天都在更新自己之前的积累] 文章链接:https://mp.weixin.qq.com/s/4oGMn1eZehGCBrmKJSf1_A ​[前言] ...

  7. 『2021语言与智能技术竞赛』- 关系抽取任务基线系统

    pycharm运行报错 通过以下的处理,实体识别和关系抽取融合成了一个序列标注问题 针对 DuIE2.0 任务中多条.交叠SPO这一抽取目标,比赛对标准的 'BIO' 标注进行了扩展. 对于每个 to ...

  8. 这个开源数据集要在全球扩大中文NLP影响力,你也能来做贡献!

    源 | 机器之心编辑部 千言的升级重点聚焦大模型时代的机遇和挑战. 「千言」是由百度联合中国计算机学会.中国中文信息学会共同发起的面向自然语言处理的开源数据集项目,旨在推动中文信息处理技术的进步.近日 ...

  9. 埃森哲启动全球品牌焕新计划;周迅担任完美日记品牌首位全球代言人 | 美通企业日报...

    今日看点 埃森哲宣布最新企业使命,并启动十年来规模最大的全球品牌焕新计划.埃森哲联合旗下创意机构Droga5共同设计主题为"应变于新,启运未来"全新品牌形象,诠释了变化的力量与美妙 ...

最新文章

  1. Windows下Hadoop的环境安装[转]
  2. Flex4之与后台服务器通信方式:URLRequest+URLLoader【JAVA方式】
  3. C#中串口通信编程 收藏
  4. python(numpy,pandas5)——numpy中copy 和 deep copy
  5. 9-18 学习如何使用Python包的管理
  6. 解决sonar scanner扫描报错Please provide compiled classes of your project with sonar.java.binaries property
  7. java pdf增删改查_如何利用Java代码操作索引库?
  8. 28 数组中出现次数超过一半的数字
  9. 做空指控不成立 百度收购YY直播已基本完成
  10. 《软件测试与质量保证》期末复习重点
  11. Linux学习之CentOS(三十二)--Linux系统服务基础
  12. ul阻燃标准有几个等级_UL阻燃标准
  13. 无涯社区分享:链网+DID,区块链应用破局的关键 | ArcBlock 活动
  14. ppt文件太大怎么压缩?
  15. 第一章 模式识别基本概念
  16. maxima学习笔记(一)
  17. JavaScript同步与异步
  18. Python自然语言处理实战(1):NLP基础
  19. 学生管理系统详细架构
  20. ubuntu16怎么升级到ubuntu18

热门文章

  1. python文件的相关操作总结
  2. BT401蓝牙音频数传BLE模块I2S音频输出说明
  3. 2015年10月起工商“三证合一” 2017年底旧证照停用 10月起工商“三证合一”
  4. 钱差点没了,京东莫名解绑手机号并注册,难道安卓手机中了木马?期待大神解释
  5. MySQL插件(一)介绍
  6. 【好奇心驱动力】DVWA(High)_菜刀连接图片一句话木马
  7. word 表格转换成文本的方法
  8. kaggle_泰坦尼克实战入门
  9. vue中点击按钮切换图片
  10. swoole-cli