数据集是推动自然语言处理技术进步的基石。为应对自然语言处理技术应用中面临的多领域、多场景等诸多挑战,百度联合中国计算机学会、中国中文信息学会,于2020年8月共同发起中文自然语言处理数据共建计划——“千言”, 推进中文信息处理技术的进步。

发布一年多以来,“千言”已针对开放域对话、阅读理解和情感分析等8个任务,汇集了来自11所高校和企业的28个开源数据集。其中,情感分析作为自然语言处理技术的基本任务之一,涵盖了句子级情感分类、评价对象级情感分类、观点抽取三个经典任务数据集,吸引了来自京东、网易、小米、平安、OPPO、新浪等多家知名企业的近300支团队参加打榜。

近日,为了更好地推动情感分析技术在大规模产业化的应用,中文信息学会情感计算专业委员会、美团与百度共同发布千言-情感分析2.0,实现两方面的重大升级。首先,在继续关注模型准确率效果的同时,加强对模型是否“可信”的评估,发布业界首个中文情感可信数据集DuTrust;其次,针对产业化中面临的任务类型、数据模态多样化的难题,提供面向真实应用场景的大规模、高质量、多模态的情感分析数据,发布业界最大规模的中文评论分析数据集ASAP和面向推荐场景的多模态情感标签数据集DuVideoSenti。

发布业界首个中文情感可信数据集DuTrust[1]

“可信AI”的概念在近几年提出,并且逐渐成为全球共识。可信AI,就是保证AI系统的可解释性、鲁棒性和公平性,确保算法可被人信任。在情感分析技术的科学研究和产业落地中,可信情感分析系统需要具备较强的鲁棒性和可解释能力,也就是要求模型针对各种不同表达,既能给出精准的预测结果,还能给出其判断依据,从而保证模型的预测结果更加置信。

作为业界首个中文情感可信数据集,DuTrust基于人工标注的扰动数据和情感证据,全部来源于真实用户评论数据,同时测试模型的鲁棒性和可解释性,全面评估模型的可信能力。

中文情感可信数据集DuTrust数据样例

以上述评论数据为例,DuTrust首先为每个样例对应标注一个扰动样本,并且标注原始样本和扰动样本的情感类别,通过计算模型在原始样例和扰动样例上预测的准确率(Accuracy)作为模型鲁棒性的评估指标。

此外,DuTrust还分别为原始样例以及扰动样例人工标注了情感的判断依据,在可解释性评估时,需要用户同时给出模型的情感判别依据,最终通过计算其与人工标注结果在字粒度上重合度F1值(F1-measure)作为模型可解释性的评估指标。

联合发布业界最大规模的中文评论分析数据集ASAP [2]

在电商场景下,一般来说情感分析涉及评论得分预估和对象级情感分类两个最基础的任务。两个任务之间天然存在很强的关联性,且在商业应用中也通常一起使用。然而现有的中文公开数据集大都针对两个任务分别构建,未能将两类任务有效联系起来。

此次“千言”与美团联合发布的业界最大规模中文评论分析数据集ASAP,首次实现对评论得分预估和对象级情感分类两个任务的联合标注,数据全部源于真实的电商场景,从数据规模和标注质量上都远超其他数据集。

中文评论分析数据集ASAP数据样例

该数据集针对输入的评论文本,人工标注整体的评论得分(1-5分),以及对应不同评价对象的情感类别(积极、消极、中性三种),并且使用准确率(Accuracy)评估模型的预测效果。

面向推荐场景的多模态视频情感标签数据集DuVideoSenti [3]

目前,个性化推荐技术迅猛发展,成为继搜索引擎之后的又一重要的信息获取途径。推荐系统的目的是为用户提供个性化的内容和服务,帮助用户快速高效的获取个性化信息。

在真实的应用场景中,往往存在大量内容题材、质量相同,但却能给用户带来不同视觉冲击和情感感受的资源。针对这类资源,需要构建能够刻画用户不同的视觉和情感感受的完备的标签体系,才能将其更好地应用于推荐系统,提升用户的体验。

千言面向推荐场景推出多模态情感标签数据集DuVideoSenti,引入视频情感泛标签预测任务,构建了视频情感泛标签体系。该体系由人工定义的“文艺清新”、“时尚炫酷”、“舒适温馨”等11个情感泛标签组成,用以刻画用户浏览视频后的视觉和情感方面的感受。数据集为每个小视频标注了情感泛标签,并且提供了视频的标题、帧图特征用于模型的训练和预测。在测试中使用准确率(Accuracy)用于评估模型的预测效果。本数据集聚焦情感分析技术在个性化推荐场景中的应用,同时有助于推动多模态学习技术的发展。

多模态视频情感标签数据集DuVideoSenti数据样例

举办基于千言-情感分析2.0的评测比赛

为了进一步推动情感分析相关研究,中国中文信息学会情感计算专业委员会与千言开源数据集项目组(www.luge.ai)还联合举办“千言情感分析常规评测比赛”,目前已有来自国内知名企业及高校超1000位选手报名参赛。

据悉,本次比赛就以千言-情感分析2.0为核心,全面评估情感分析模型在多种模态场景下的预测准确率、模型的鲁棒性和可解释性指标。除了有挑战性的赛题,百度飞桨 AI Studio 将为选手提供免费的Tesla V100 GPU算力,千言数据集还将为优胜团队颁发证书,并发放精美的定制礼品。

报名及竞赛详情链接:
https://aistudio.baidu.com/aistudio/competition/detail/50/0/task-definition

未来,希望有更多的情感分析领域科研学者、领域专家参与共建千言-情感分析榜单,共同推动中文情感分析技术的进步,建设世界范围内的中文情感分析影响力。

点击进入获得更多技术信息~~

聚焦可信AI与产业应用,百度联合发起千言计划实现情感分析2.0升级相关推荐

  1. AI学习笔记(十八)NLP常见场景之情感分析

    目录 情感分析 基于情感词典的传统算法 基于深度学习的算法 情感分析 情感分析是自然语言处理中常见的场景,对于指导产品更新迭代具有关键性的作用. 通过情感分析,可以挖掘产品在各个维度的优劣,从而明确如 ...

  2. “千言”开源数据集项目全面升级:数据驱动AI技术进步

    "千言"是由百度联合中国计算机学会.中国中文信息学会共同发起的面向自然语言处理的开源数据集项目,旨在推动中文信息处理技术的进步.近日,在2021年12月12日的 WAVE SUMM ...

  3. 进入工业大生产阶段,能让AI真正产业落地的关窍是什么?

    AI深入产业落地,关键在于人才. 大模型等基础共性AI技术降低应用门槛 AI人才推动产业智能化升级 近期,在由深度学习技术及应用国家工程研究中心与百度联合发起的AICA首席AI架构师培养计划第五期.第 ...

  4. 百度NLP“十年十人”重磅亮相,推出全球最大中文NLP数据共建计划“千言”

    自然语言理解(NLP)素有"人工智能皇冠上的明珠"盛誉,这也意味着语言与知识等认知层面的技术突破将进一步促进AI深入发展. 8月25日,以"掌握知识.理解语言.拥有智能& ...

  5. 前沿重器[7] | 小布助手登顶百度千言短文本相似度的秘诀

    [前沿重器] 栏目主要给大家分享各种大厂.顶会的论文和分享,从中抽取关键精华的部分和大家分享,和大家一起把握前沿技术.具体介绍:仓颉专项:飞机大炮我都会,利器心法我还有. 往期回顾 前沿重器[2] | ...

  6. 【干货】百度联合清华大学发布国内首个基于AI实践的《产业智能化白皮书》(附报告全文)...

    来源:百度AI 在4月9日举行的"百度大学 Alpha 学院首期学员毕业典礼"上,百度联合清华大学发布国内首个基于 AI 实践的行业重磅报告,<产业智能化白皮书--人工智能产 ...

  7. WAIC 2022 | 洞见科技在可信AI论坛联合发布《可信人工智能产业生态发展报告》

    2022年9月1日,「2022世界人工智能大会·可信AI论坛」在上海成功举办,洞见科技合伙人.副总裁李博受邀出席论坛.会上,洞见科技与中国信通院.京东探索研究院.清华大学.中国科学技术大学.交通银行. ...

  8. 信通院发布“2023可信AI案例 知识计算应用优秀案例”, 百度知识中台三大案例入选

    近日,中国信息通信研究院依托中国人工智能产业发展联盟.AI工程化委员会知识计算工作组公布了"2023可信AI案例知识计算应用优秀案例"名单.基于百度知识中台打造的"国能绥 ...

  9. 百度飞桨中国行南京站开启!共研AI赋能产业新模式

    面对未来发展,以人工智能为代表的新一代技术逐渐成为产业转型的核心驱动力之一,人工智能的发展离不开创新和人才.在这一大背景下,百度推出"飞桨中国行"活动,计划走入全国多个 AI 重点 ...

最新文章

  1. 独家 | 13大技能助你成为超级数据科学家!(附链接)
  2. 【转】最佳 WordPress 缓存插件:WP Super Cache
  3. Python爬虫应用实战案例-pyquery在爬虫中的应用,爬取猫眼电影数据
  4. python3列表推导式
  5. 使用注解版AOP解决事务问题
  6. 3分钟学会SVN:SVN快速上手
  7. iApp对接hybbs社区APP源码
  8. vue引入如何使用不同字体
  9. git删除分支_程序员必须要掌握的 Git 使用技巧
  10. java jtable 按钮_java web 怎么在jtable中添加按钮?
  11. vm9.02的序列号
  12. 统一建模语言——UML
  13. FME突然无法连接FMS服务器
  14. AD(altium designer)15原理图与PCB设计教程(五)——工程编译与报表生成
  15. 【美化桌面】删除电脑桌面快捷键箭头
  16. Script Identification of Multi-Script Documents: A Survey
  17. php neq(),ThinkPHP 模板 if ... else  neq,eq
  18. 跑深度模型的显卡_GPU必知必会 | 哪款显卡配得上我的炼丹炉
  19. 啊哈算法---水管工游戏
  20. 2022-2028年中国修正带行业市场全景调查及投资策略研究报告

热门文章

  1. ASP.NET跨页面传值(二)
  2. 信息化十七载 ERP重塑双良战略与核心价值
  3. java 面向对象的特性 抽象_java面向对象的四个特性
  4. linux fedora35 zsh oh-my-zsh 的配置与使用
  5. k8s serviceaccount pod亲和性 污点
  6. 80070583类不存在_结合JVM源码谈Java类加载器
  7. 装配图中齿轮的画法_春季高考机械专业中机械制图考什么?重点是什么?
  8. eclipse去掉javascript校验
  9. myeclipse中,项目上有个叉报错,文件没有错误
  10. oracle备份还原到本地_Oracle 11g R2 RAC数据库备份通过RMAN恢复到单实例数据库实现...