日前,华为云在知识计算领域的多跳知识推理问答取得重大进展。基于自然语言处理领域的领先技术积累,华为云语音语义创新Lab联合华为诺亚方舟实验室在国际权威的HotpotQA评测Fullwiki Setting赛道荣登榜首,在答案模糊准确率和联合模糊准确率(Joint F1)等指标上均达到第一。

HotpotQA评测(Fullwiki Setting赛道)最新榜单(截至2021年1月20日)

作为企业重要的信息载体,数字化文档记录了大量企业知识,如何快速帮助企业员工从数字化文档中获得答案,是企业文档维护人员的痛点。为解决此问题,一方面需要较强的阅读理解技术,另一方面还需要构建一套复杂的开放域问答流程。

HotpotQA评测数据是斯坦福、CMU和蒙特利尔大学联合推出的新型问答数据集,由斯坦福的Manning教授和深度学习三巨头之一的Bengio牵头构建,该数据集由多跳复杂问题以及对应的答案组成,同时包含佐证证据用来解释答案的来源。在斯坦福此前公布的SQUAD评测任务中,机器已经多次超过人类,该评测仅需要从单个篇章中找到与问题有关的答案即可,故相对简单。然而,HotpotQA评测需要从整个wikipedia或者多篇文章中找出问题相关的答案,同时要求返回问题到答案的推理链,难度大大增加更具有挑战性。该评测也吸引了来自谷歌、微软、Facebook等知名研究机构以及CMU、Stanford、华盛顿大学、清华大学、北京大学等知名高校。

挑战多跳知识推理技术高点

HotpotQA评测的难点在于机器要结合多篇文章进行多跳推理才能得出答案,并返回佐证证据。该评测分为Distractor Setting和 Fullwiki Setting两个赛道。Fullwiki Setting相较于Distractor Setting更为复杂也更接近实用价值,需要从整个维基百科文档中抽取文档,然后再从文档中提取段落,最后从段落中抽取答案,而Distractor Setting赛道会提供10篇备选的篇章。如何从大量文档段落中去多跳搜索候选,然后理解候选段落的内容提取佐证证据成为比赛的关键。

华为云联合华为诺亚方舟实验室,提出了新的检索目标hop,用于收集维基百科中隐藏的推理证据,解决复杂多跳问题,同时结合beam search对答案进行排序和融合。

从维基百科文本图谱中检索跳转(Hops)

如今,企业面临着数字化、知识化转型,知识化转型重要的关键技术就是知识的理解和推理,该技术对企业知识转型具有重大的意义和推动作用。2020年华为云推出知识计算解决方案,企业可以基于华为云知识计算解决方案打造自己的知识计算平台,用于研发、生产、运营、销售、售后服务等企业核心流程。目前,该方案已在石油、汽车、医疗、化纤、煤焦化、钢铁、交通等行业率先实践。

点击关注,第一时间了解华为云新鲜技术~

华为云登顶HotpotQA多跳知识推理问答评测相关推荐

  1. 筑道与寻术:华为云与汽车产业的时代问答

    汽车,正在变成产生数据.应用数据.释放数据价值的超级终端.根据相关统计,到2025年中国网联车渗透率大于62%,而L2及以上的自动驾驶车辆渗透率将达到49%.网联化与智能化的汽车变迁,带来了汽车产业海 ...

  2. 华为服务器修改root密码,华为云服务器root权限设置密码

    华为云服务器root权限设置密码 内容精选 换一换 如果您需要对购买的ECS资源,给企业中的员工设置不同的访问权限,以达到不同员工之间的权限隔离,您可以使用统一身份认证服务(Identity and ...

  3. 华为云大数据存储的冗余方式是三副本_揭秘!10+位DBA大神测评华为云DDS增强版实感...

    数据库.操作系统.中间件并称为核心基础软件,在 IT 软件堆栈中起到中流砥柱的作用.今天运行的绝大多数企业应用软件都离不开数据库的支持. 随着移动互联网.物联网.云计算.大数据等新技术爆发式发展,图片 ...

  4. 华为云大数据存储的冗余方式是三副本_大数据显示华为云DDS增强版实感卓越

    数据库.操作系统.中间件并称为核心基础软件,在 IT 软件堆栈中起到中流砥柱的作用.今天运行的绝大多数企业应用软件都离不开数据库的支持. 随着移动互联网.物联网.云计算.大数据等新技术爆发式发展,图片 ...

  5. 揭秘!10+位DBA大神测评华为云DDS增强版实感

    [摘要]数据库.操作系统.中间件并称为核心基础软件,在 IT 软件堆栈中起到中流砥柱的作用.今天运行的绝大多数企业应用软件都离不开数据库的支持. 随着移动互联网.物联网.云计算.大数据等新技术爆发式发 ...

  6. 华为鲁勇:自己做的降落伞自己先跳 华为云这样赢得客户信赖

    很多时候,做事情的理念和原则就已经决定了这件事能否成功,华为做云也是如此. 如果云不能够顺利的落地应用,一切都是浮云. 这话不只适用于那些热切希望通过云计算.AI等新技术的应用.实现数字化转型的企业客 ...

  7. 华为云WeLink智能语音助手专题(下篇:WeLink智能助手如何配置智能问答?)

    通过上篇中篇智能语音助手专题,估计你已经领教到了小微的强大和方便了吧,但是觉得小微智能问答的内容还不足以满意业务需求,那么能不能自己增加一些问答呢?别怀疑,当然可以啦,快来跟博主学学怎么配置自定义智能 ...

  8. 华为云负载均衡配置http强制跳转https

    项目部署在华为云上,之前在nginx服务器上配置301跳转,页面访问总是报错重定向次数过多,之后就想是否直接可以在负载均衡上做跳转,于是查官方文档果然有方法,于是乎先记录下来.

  9. 华为云苏嘉:如何整合预训练模型和知识图谱做医疗推理?

    本文约4100字,建议阅读8分钟 本文将讨论如何为AI+医疗提供一种行之有效的解决方案. [ 导读 ] 随着人工智能技术特别是深度学习的普及,医疗行业也迎来一波革命的热潮,本文将讨论如何利用AI技术将 ...

最新文章

  1. 用sublime server 启动本地服务器(手机访问电脑页面)
  2. 基于机器学习逻辑回归算法完成癌症病人的肿瘤是否良性的判断
  3. Leetcode: Populating Next Right Pointers in Each Node II
  4. 看透 Go 对象内部细节的神器
  5. 这本 “写不完” 的黑科技笔记本,恐怕要颠覆整个行业!
  6. NHibernate之旅(4):探索查询之条件查询(Criteria Query)
  7. FCPX无缝扭曲过渡转场Twirl Transition Pack for Mac
  8. 网信办:从严整治激情打赏、高额打赏、诱导打赏
  9. 比较SynchronizedMap、Hashtable和ConcurrentHashMap的效率
  10. l298n电机驱动模块使用方法_家用柴油发电机使用方法
  11. 每天一道剑指offer-二叉树中和为某一值的路径
  12. Dijkstra(堆优)模板
  13. LISP 冻结excel窗格_Excel这10个实操技巧,每个都很牛逼,绝对不能错过
  14. c语言编fft算法程序,用C语言实现FFT算法
  15. 首都师范 博弈论 9 5 5引入物质奖励后的博弈模型
  16. HTTP 压力测试工具 wrk和ab
  17. markdown编辑器之editormd使用
  18. ipv6的127位掩码如何表示_IPv4地址、子网掩码、详细讲解
  19. 100首经典广告背景音乐
  20. 南传法句经(摘选)03

热门文章

  1. 递归函数之阶乘的实现
  2. Bootstrap 字体图标Glyphicons
  3. Bootstrap 源码版文件结构
  4. 视觉SLAM笔记(42) 光流法跟踪特征点
  5. 视觉SLAM笔记(12) 四元数
  6. 深度学习笔记(14) 评估指标
  7. tikz 折线 箭头_问一个关于latex中,使用tikz画图的问题,如何使箭头上方的权值不居中(因为居中会互相重叠)...
  8. unity text不能刷新_unity自走棋制作(二)-UI制作
  9. 渗透测试学习 十一、 其他注入漏洞汇总
  10. POJ1958 Strange Towers of Hanoi [递推]