2020-01-06 10:26

导语:使用分离的语义和语法特征来研究大脑对应的神经基础。

作者 | 王少楠、张家俊

语义和语法是自然语言中最重要的特征。已有神经影像学的研究证明大脑处理语义和语法的神经基础是不同的,但是目前关于自然语言中语义和语法是否在大脑中分开编码以及具体编码的脑区并没有一致的结论。

由于大脑语言处理过程十分复杂,传统认知神经科学使用人工设计的语料来收集神经影像数据进而研究这个问题。由于人工设计的语料脱离了人类通常的语言理解环境,结论无法泛化到实际语言场景中,另外受控刺激会引入语言理解之外的因素,因而无法得出人脑在自然语言理解情况下语义和语法表征的结论。

为了解决上述问题,我们提出了一种利用解纠缠的计算模型特征研究人脑对应表征的框架,可以适用于任何自然语言刺激实验中。针对大脑语义和语法表征的问题,我们利用计算模型将句子中的语义和语法特征区分开,使用分离的语义和语法特征来研究大脑对应的神经基础。

图1基于解纠缠特征的人脑表征研究的计算框架

论文方法

针对上述问题,中科院自动化所自然语言处理组王少楠助理研究员、张家俊研究员、宗成庆研究员和中科院心理所林楠副研究员合作提出了一种利用解纠缠的计算模型特征研究人脑对应表征的框架,用于研究人脑对应语义和语法的表征。

如图1所示,该框架分为两个部分,首先构造解纠缠的特征表示模型,接着用分离的特征表示向量在大脑激活数据中寻找对应特征最相关的脑区。具体来说,我们提出一种解纠缠的特征表示模型(DFRM)。如图2所示,该模型属于双通道的变分自编码器,利用两个隐含变量分别表示语义特征变量和语法特征变量。具体使用词向量平均编码器来抽取句子中的语义特征,利用长短时记忆网络(LSTM)来抽取句子中的语法特征,接着通过令语义变量学习区分两个句子是否含义相同,令语法变量学习区分两个句子是否语法相同的目标函数,使语义变量积累语义信息,语法变量积累语法信息。

该模型通过上述目标函数以及变分自编码器的重构误差学习语义和语法变量的分布形式,最终该模型可以用语义变量为每个句子生成语义向量,用语法变量为每个句子生成语法向量。

图 2 解纠缠特征表示模型

利用上述语义向量和语法向量,通过神经编码技术,我们可以研究大脑对应的语义和语法表征。具体来说,通过上述计算模型可以得到每个句子的语义向量和语法向量,利用所有句子中每两个句子求余弦相似性可以得到句子之间的语义相似度矩阵和语法相似度矩阵。同样的,对于大脑来说,每个脑区对每个句子都有一系列激活数值,对每两个句子间的激活向量求余弦相似性可以得到每个脑区的句子理解相似度矩阵。最后利用计算模型得到的语义相似性矩阵和语法相似性矩阵分别与每个脑区的相似性矩阵做相关性分析,即可以得到与语义最相关的脑区和与语法最相关的脑区。

实验结果

表1给出了不同模型在语义和语法任务上的不同表现。实验结果表明,我们提出的解纠缠特征表示模型(DFRM)可以最大限度的区分句子中语义和语法信息,在语义和语法相似性数据集上取得了最好的结果。

表1不同模型在多个语言对上的实验结果

如图3和图4所示,将上述语义和语法向量应用于两个fMRI句子理解数据集上,我们发现语义表征比语法表征在大脑中各个区域的激活更加稳定,包括默认网络(default-model network),额顶叶(frontoparietal),视觉网络(visual networks)等。语义和语法的大脑表征在很大程度上重叠,也有少数脑区仅对一个脑区敏感。例如,部分额叶(frontal)和颞叶(temporal)区域是语义特征所特有的。部分右上额叶(right superior frontal)和右下顶叶(rightinferior parietal)区域是语法特有的。

图3 语义语法向量与大脑fMRI数据的相似性编码分析结果(数据集1)

图4 语义语法向量与大脑fMRI数据的相似性编码分析结果(数据集2)

这项工作的主要贡献在于:

  • 提出了一种利用计算模型研究大脑中不同语言属性如何表征的框架。除了研究人脑语义语法的表征之外,也可以用来研究语言中的其他属性如视觉、语音和情绪等。

  • 提出一种解纠缠的特征表示模型,可以在一定程度上分离句子中的语义和语法信息,为每个句子生成一个语义向量和一个语法向量。

  • 实验结果从计算的角度为大脑语义和语法表征机制提供了新的证据,证实并扩展了已有认知神经科学的发现,表明了利用自然语言处理模型可以帮助我们研究脑大脑语言理解机理。

相关细节可参考发表于人工智能顶级学术会议AAAI 2020的论文:

Shaonan Wang, JiajunZhang, Nan Lin and Chengqing Zong. Probing Brain Activation Patterns byDissociating Semantics and Syntax in Sentences. The Thirdy-Fourth AAAIConference on Artificial Intelligence, Feb. 7-12, 2020, New York, USA.

AAAI 2020 | 通过解纠缠模型探测语义和语法的大脑表征机制相关推荐

  1. 【解纠缠表示:图像增强】

    DRLIE: Flexible Low-Light Image Enhancement via Disentangled Representations (DRLIE:基于解纠缠表示的柔性弱光图像增强 ...

  2. AAAI 2020论文解读:商汤科技发布新视频语义分割和光流联合学习算法

    来源 | Every Frame Counts: Joint Learning of Video Segmentation and Optical Flow 编辑 | Carol 出品 | AI科技大 ...

  3. AAAI 2020 | NAS+目标检测:AI设计的目标检测模型长啥样?

    ©PaperWeekly 原创 · 作者|刘畅 学校|上海交通大学博士生 研究方向|计算机视觉 太长不看版 论文标题:SM-NAS: Structural-to-Modular Neural Arch ...

  4. AAAI 2020 开源论文 | 可建模语义分层的知识图谱补全方法

    ©PaperWeekly · 作者|蔡健宇 学校|中国科学技术大学 研究方向|知识图谱 近些年,知识图谱(Knowledge Graph)在自然语言处理.问答系统.推荐系统等诸多领域取得了广泛且成功的 ...

  5. AAAI 2020 开源论文 | 语义感知BERT(SemBERT)

    作者丨张倬胜 学校丨上海交通大学硕士生 研究方向丨自然语言理解 本文从计算语言学角度,提出使用显性语义角色信息来改善深度语言模型的建模性能,将语义角色标注用于机器阅读理解和推理任务中,提供更加丰富和精 ...

  6. AAAI 2020 开源论文 | 一种针对图嵌入模型的受限黑盒对抗攻击框架

    AAAI(人工智能促进协会年会)是人工智能领域的顶级国际会议之一.今年的 AAAI 2020 是第 34 届,于 2 月 7 日至 12 日在美国纽约举行.今年,第 3 次参会的腾讯 AI Lab 共 ...

  7. AAAI 2020 | 时间可以是二维的吗?基于二维时间图的视频内容片段检测

    作者 | 彭厚文.傅建龙 来源 | 微软研究院AI头条 编者按:当时间从一维走向二维,时序信息处理问题中一种全新的建模思路由此产生.根据这种新思路及其产生的二维时间图概念,微软亚洲研究院提出一种新的解 ...

  8. 时间可以是二维的?基于二维时间图的视频内容片段检测 | AAAI 2020

    作者 | 彭厚文.傅建龙 来源 | 微软研究院AI头条(ID: MSRAsia) 编者按:当时间从一维走向二维,时序信息处理问题中一种全新的建模思路由此产生.根据这种新思路及其产生的二维时间图概念,微 ...

  9. AAAI 2020| 一文看尽腾讯优图10篇入选论文

    点击上方"深度学习技术前沿",选择"星标"公众号 资源干货,第一时间送达 人工智能领域的国际顶级会议AAAI 2020将于2月7日-2月12日在美国纽约举办.近 ...

最新文章

  1. 光缆能预警地震?谷歌做到了!毫秒级反应速度,140万公里海缆有望成为报警器...
  2. AngularJS——第3章 指令
  3. Binder通信机制介绍
  4. IntelliJ IDEA的使用操作链接
  5. C语言头文件、库文件的查找路径
  6. firebird 行级锁问题_MySQL 锁
  7. 第二节 DOM-Document对象
  8. 大芒果 mysql 断开_大芒果3.3.5进入显示 与服务器断开连接
  9. 基站定位php,基于Python的移动联通基站接口调用代码实例
  10. 删除页眉页脚中横线的方法
  11. 嵌入式 Linux C 代码规范和风格
  12. matlab求解常微分方程(组)---dsolve、ode系列函数详解(含例程)
  13. 【Tableau Desktop 企业日常技巧16】Tableau下载和安装ODBC驱动 连接MySQL方法及过程详解
  14. 最好用的开源日志分析工具
  15. 部门来了个拿25k出来的00后测试卷王,老油条表示真干不过,已被...
  16. 半导体存储器涨涨涨 趋势的力量不可逆转
  17. 2021年茶艺师(初级)考试题及茶艺师(初级)模拟考试
  18. 车削加工出现振刀打刀现象,咋处理呢?
  19. MapInfo点符号的制作方法
  20. Apache Beam简介及相关概念

热门文章

  1. 经典 Python参数传递采用的肯定是“传对象引用”的方式。相当于传值和传引用的一种综合。如果函数收到的是一个可变对象(比如字典或者列表)的引用,就能修改对象的原始值--相当于通过“传引用”来传递对象
  2. Python字符串编码坑彻底详细解决 何梁
  3. RPC实现MQ通信的一个小例子
  4. IDEA如何将git分支代码合并到master
  5. 北京智源新星计划启动,大力支持人工智能青年人才
  6. 日本漫画巨匠力作,看漫画就能学会Python,简直不要太轻松
  7. 米兰大学发布论文与猫咪叫声数据集,分类喵喵叫
  8. 原创 | 看过《中国机长》,我开始关心航空预测性维修这件事了
  9. 成为数据科学家、人工智能和机器学习工程师的自学之路
  10. 深度分享 | 世界顶级语音识别科学家黄学东博士CCL 2018主旨报告(附PPT)