2018 年,任务导向对话数据集 MultiWOZ 横空出世,并被评为当年 EMNLP 最佳资源论文。由于其大规模多领域的特点,引发了任务导向对话领域新的一轮发展热潮。

为了进一步推动多领域(特别是跨领域)的研究以及填补中文任务导向对话数据的空白,清华大学计算机系、人工智能研究院 CoAI 小组构建了 CrossWOZ,一个大规模跨领域中文任务导向对话数据集。论文已被 Transactions of the Association for Computational Linguistics (TACL) 接收。

论文链接:https://arxiv.org/abs/2002.11893

数据和代码:https://github.com/thu-coai/CrossWOZ

▲ CrossWOZ的一个对话片段,具体酒店名字被A,B,C替代

相比于之前的任务导向对话数据集(特别是MultiWOZ),CrossWOZ有三大特点:

1. 在对话中,用户在某个领域的选择可能会影响到与之相关的领域的选择。如上面的这个例子,用户选择了北京欢乐谷作为景点领域的结果,那么之后选择的酒店就要在它附近。不同的景点选择会对酒店产生不同的约束。这种跨领域约束随着对话的进行而具体化,需要对话双方都能对上下文有更好的理解,因而更具有挑战性。

2. 这是第一个中文大规模多领域任务导向对话数据集,包含 6K 个对话,102K 个句子,涉及 5 个领域(景点、酒店、餐馆、地铁、出租)。平均每个对话涉及 3.2 个领域,远超之前的多领域对话数据集,增添了对话管理的难度。

3. 标注信息全面,可以用于研究任务导向对话系统中各个方面。除了提供对话双方的对话意图、系统端的对话状态这些信息之外,还额外提供了每轮用户端的对话状态。用户端状态记录了目标的完成情况,每轮根据系统回复动态更新,可用于研究用户模拟器的搭建。

数据收集过程

收集数据时模拟的对话场景是一名游客向系统咨询北京的旅游信息,分为以下几个步骤:

1. 领域数据库构建:从网络上爬取了北京的景点、酒店、餐馆信息,以及这些地点的邻近关系。同时这些地点附近的地铁站组成了地铁数据库。出租领域无需数据库。

▲ 数据库统计信息

2. 用户目标生成:通过随机采样的方式生成各领域的目标。如下表,有值的表示约束条件,没有值的表示需求信息,粗体的表示跨领域的约束,用占位符表示。这个例子里用户要找一个免费的景点及其附近一家提供叫醒服务的酒店,并预订一辆从景点到酒店的出租。

▲ 用户目标示例

3. 对话数据收集:雇佣人员在线匹配进行实时对话。用户端以用户目标作为初始状态,通过对话获取信息,每轮更新用户状态,填写需求的信息和替换跨领域的约束。并选择本轮要表达的约束或者要询问的信息。系统端每轮维护各个领域的查询表单作为系统状态,根据查询结果回复用户。

4. 数据处理:使用一些规则根据用户和系统的状态推导出对话意图。经过三个专家对少量对话的核验,数据标注质量较高。

数据统计

将对话分成五种类型:单领域 S,多领域 M,多领域加交通 M+T,跨领域 CM,跨领域加交通 CM+T。交通代表了地铁和出租领域,M 和 CM 的区别是有没有跨领域的约束。

统计信息如下表。可以发现含有跨领域约束的对话 (CM,CM+T) 会导致更多的系统多次查找 (Multi-query)、找不到结果 (NoOffer)、用户自主修改目标 (Goal change) 的情况。

基线模型

由于丰富的标注信息,CrossWOZ 数据集可用于多种任务的研究。依托于 ConvLab-2 对话平台,我们提供了 NLU、DST、Policy、NLG 的基线模型以及 user simulator,部分结果如下表。实验说明跨领域的约束对各个任务都有挑战性。

点击以下标题查看更多往期内容:

  • 深度学习预训练模型可解释性概览

  • 如何使用知识图谱增强信息检索模型?

  • AAAI 2020 | 可建模语义分层的知识图谱补全

  • 浅谈Knowledge-Injected BERTs

  • BERT+知识图谱:知识赋能的K-BERT模型

  • 从 Word2Vec 到 BERT

#投 稿 通 道#

 让你的论文被更多人看到 

如何才能让更多的优质内容以更短路径到达读者群体,缩短读者寻找优质内容的成本呢?答案就是:你不认识的人。

总有一些你不认识的人,知道你想知道的东西。PaperWeekly 或许可以成为一座桥梁,促使不同背景、不同方向的学者和学术灵感相互碰撞,迸发出更多的可能性。

PaperWeekly 鼓励高校实验室或个人,在我们的平台上分享各类优质内容,可以是最新论文解读,也可以是学习心得技术干货。我们的目的只有一个,让知识真正流动起来。

???? 来稿标准:

• 稿件确系个人原创作品,来稿需注明作者个人信息(姓名+学校/工作单位+学历/职位+研究方向)

• 如果文章并非首发,请在投稿时提醒并附上所有已发布链接

• PaperWeekly 默认每篇文章都是首发,均会添加“原创”标志

???? 投稿邮箱:

• 投稿邮箱:hr@paperweekly.site

• 所有文章配图,请单独在附件中发送

• 请留下即时联系方式(微信或手机),以便我们在编辑发布时和作者沟通

????

现在,在「知乎」也能找到我们了

进入知乎首页搜索「PaperWeekly」

点击「关注」订阅我们的专栏吧

关于PaperWeekly

PaperWeekly 是一个推荐、解读、讨论、报道人工智能前沿论文成果的学术平台。如果你研究或从事 AI 领域,欢迎在公众号后台点击「交流群」,小助手将把你带入 PaperWeekly 的交流群里。

CrossWOZ,一个大规模跨领域中文任务导向对话数据集相关推荐

  1. 【论文翻译】2020.8 清华大学AI课题组——大型中文短文本对话数据集(A Large-Scale Chinese Short-Text Conversation Dataset)

    大型中文短文本对话数据集 写在前面: 研究用,原创翻译,转载请标明出处:第一次译文,之后会跟进完善.侵删.   今年暑假末,清华大学公开了大型对话数据集及预训练模型.该数据集融合各大社交媒体对话数据库 ...

  2. RiSAWOZ中文任务型对话数据集

    RiSAWOZ中文任务型对话数据集 标题:<RiSAWOZ: A Large-Scale Multi-DomainWizard-of-Oz Dataset with Rich Semantic ...

  3. 论文阅读9 | COCAS:一个大规模换装的行人重识别数据集

    论文:COCAS: A Large-Scale Clothes Changing Person Dataset for Re-identification 出处:CVPR 2020 文章目录 1. 创 ...

  4. ACL 2021|CHASE: 首个跨领域多轮Text2SQL中文数据集

    ©PaperWeekly 原创 · 作者 | 徐叶琛 单位 | 字节跳动 研究方向 | NLP语义理解.问答系统 自然语言处理语义解析子任务 Text2SQL 旨在将用户的自然语言转换为 SQL 序列 ...

  5. NLP领域中文对话系统数据集总结(有下载地址)

    一.豆瓣多轮对话数据集 1.简介: 测试数据包含 1000 个对话上下文,对于每个上下文,创建 10 个响应作为候选.正确的响应意味着响应可以自然地回复给定上下文的消息.每对收到三个标签,大多数标签被 ...

  6. WSDM 2022 | 中科院、腾讯、北航提出:跨领域推荐中的个性化迁移用户兴趣偏好...

    点击上方"视学算法",选择加"星标"或"置顶" 重磅干货,第一时间送达 冷启动推荐一直是推荐系统中一个极具挑战的问题.跨领域推荐系统使用源领 ...

  7. XLORE2:大规模跨语言知识图谱构建与应用

    论文地址:XLORE2: Large-scale Cross-lingual Knowledge Graph Construction and Application ABSTRACT XLORE2 ...

  8. 跨领域的智能云管理平台-孙立辉(云平台 CSM)

    跨领域的智能云管理平台 文/孙立辉 杨昂凯 由于信息化水平的快速提高,IT的建设模式已经开始向云模式迁移,越来越多的企业开始尝试部署云计算.云计算的实质是简单化.平台化和服务化.在云管理平台上企业IT ...

  9. 跨领域推荐项目库RecBole-CDR——使用经验

    文章目录 一.整体数据流 二. 一些重要参数设置 三.利用Yaml文件 设置参数 四.RecBole-CDR支持的模型 五.RecBole-CDR提供的跨领域数据集 RecBole-CDR 是一个基于 ...

最新文章

  1. Spark SQL与外部数据源的操作(Spark SQL ——> CSV/JSON/Parquet/hive/mysql)
  2. SQL中ISNULL的问题。
  3. linux网络服务器框架转载
  4. Apache与nginx的优缺点对比
  5. git遇到的问题之“Please make sure you have the correct access rights and the repository exists.”...
  6. Flume实战监听文件夹内文件变化
  7. ccfb类会议有哪些_CCF推荐国际学术会议
  8. java面向对象数组实现家庭收支记账软件_golang实战--家庭收支记账软件(面向过程)...
  9. 厦门大学 软件学院 夏令营
  10. 虚拟机包OVF和OVA的区别
  11. 【扫盲贴】浅谈38K红外发射接受编码(非常好)
  12. 同样的代码不同环境 提示握手失败:ssl_client_socket_impl.cc handshake failed
  13. 【OpenCV 例程 300篇】240. OpenCV 中的 Shi-Tomas 角点检测
  14. python实现寻迹功能
  15. 能力素质有所欠缺_心理素质要怎么锻炼?
  16. python报错No module named XXX解决方法
  17. 阿里巴巴开源项目: 基于mysql数据库binlog的增量订阅amp;消费
  18. JTAG, TTL, CFE
  19. uniapp:常用跨端业务组件(ts版本)
  20. 实现机器人避障的全套解决方案

热门文章

  1. php 时间操作归类
  2. flume-source
  3. oracle omf管理 and asm omf
  4. 在 C# 中,new 关键字可用作运算符、修饰符或约束。
  5. ORACLE8的分区管理
  6. java坐标移动题目case_坐标移动
  7. sap 無法建立 activex 元件_安徽陶瓷膜芯元件
  8. python入门神器_爬虫 (一) 神器准备篇
  9. linux可以ping通,Linux可以Ping通但不能traceroute
  10. ubuntu ssh如何连接mysql_ubuntu配置ssh连接方式