问耕 编译整理
量子位 出品 | 公众号 QbitAI

曾经的王牌美剧《CSI:犯罪现场调查》,现在成了AI用来提高断案推理能力的试验场。

这部剧集厉不厉害?据说已成为美国警方的必备学习教材,连英国苏格兰场、日本警卫厅以及法国警局都视之为反恐教材。

爱丁堡大学的一个研究团队,把《CSI:犯罪现场调查》剧集脚本变成自然语言的训练数据集,输入一个LSTM模型。他们的目标是帮助机器更好的进行自然语言理解,以及训练与之相关的复杂推理能力。

之所以选定这部剧集,原因很简单。《CSI:犯罪现场调查》有着严格的公式化剧本,完全可以被预测。

“每一集都提出了同样的基本问题(即谁是凶手),而罪犯被抓住时自然就给出了答案”,研究人员表示。剧集中的调查人员会对犯罪现场进行研究,找到无可辩驳的证据,抽丝剥茧的把真凶揭露出来。

所以,“谁是真凶”就变成了一个简单的序列标签问题。

研究人员假设这个AI模型和人类一样,从剧集中获得一系列的信息输入,包括文本、视频或者音频,并能据此推测凶手。

结果表现

AI真的可以找到凶手么?

《CSI:犯罪现场调查》数据集上的实验表明,多模态表示对于自然语言理解非常重要。另外,增量推理策略是准确找到真凶的关键。

研究人员希望模型的预测能力,最终可以超越人类。

上图是目前这套系统的评估表现。人类的平均预测精度接近85%,而AI的准确率超过60%。这是一个让研究人员欢欣鼓舞的成绩。

不过作为对比的人类样本还很小(只有三个)。另外与LSTM模型相比,人类的预测精度更高,但通常更为谨慎。AI看剧本会在大约第190句话时猜测真凶,而人类通常在第300句话时才第一次作出判断。

目前还有一些情景,会让AI有点摸不清头脑。例如在数据集中包括一些自杀案件,对这类情况AI还不能很好的处理。与之相比,在三分之二的情况下,人类最终能够意识到案件其实没有其他凶手参与。

研究人员会继续研究如何改善这方面的情况。

不知道以后会不会有人用“狄仁杰”系列训练AI呢?“元芳……”

模型架构

推理任务的顺序特性,适用于循环网络建模。研究人员采用的架构,是把单向的LSTM网络与一个softmax输出层相结合。

模型被喂给一系列(可能是多模态)的输入,每个输入对应于脚本中的一个句子,并且指定一个标签l,直来表示句子中提到了罪犯(l=1)或者没有(l=0)。这是个增量模型,每个标签的决策仅与之前的输入信息有关。

上图概述了罪犯预测任务。图像、音频和文本等输入模型中,每个模态都映射成一个特征表示,融合之后传递给LSTM。然后LSTM来判断其中是否提及罪犯,并给l赋予1或者0的数值。

这张图显示的就是两个时间步长的LSTM模型输入/输出结构。

这个模型的核心,是一个单项LSTM网络。LSTM对于一系列多模态输入的计算,采用了如下的方式:

另外,多模态融合采用了如下的方式:

研究人员还比较了几种不同的模型架构。

相关下载

论文

摘要:《CSI:犯罪现场调查》是近似真实世界自然年语言理解和与之相关复杂推理的理想试验台。我们把犯罪剧集作为一个新的推理任务,利用每个事件提出相同的基本问题(即凶手)这一事实,最后找到真凶时自然就能获得答案。我们基于《CSI:犯罪现场调查》开发了一个新的数据集,将寻找真凶变成一个序列标签问题,并开发了一个从多模态数据中学习的LSTM模型。实验结果表明,增量推理策略是进行准确猜测以及从文本、视觉和声音输入融合表示中学习的关键。

论文地址:

https://arxiv.org/pdf/1710.11601.pdf

素材

研究人员把部分研究素材也在网上公开了。

GitHub地址:

https://github.com/EdinburghNLP/csi-corpus

加入社群

量子位AI社群11群开始招募啦,欢迎对AI感兴趣的同学,加小助手微信qbitbot4入群;

此外,量子位专业细分群(自动驾驶、CV、NLP、机器学习等)正在招募,面向正在从事相关领域的工程师及研究人员。

进群请加小助手微信号qbitbot4,并务必备注相应群的关键词~通过审核后我们将邀请进群。(专业群审核较严,敬请谅解)

诚挚招聘

量子位正在招募编辑/记者,工作地点在北京中关村。期待有才气、有热情的同学加入我们!相关细节,请在量子位公众号(QbitAI)对话界面,回复“招聘”两个字。

量子位 QbitAI

վ'ᴗ' ի 追踪AI技术和产品新动态

谁是真凶?《CSI:犯罪现场调查》正帮助AI提高断案能力相关推荐

  1. 犯罪现场调查第一季/全集CSI迅雷下载

    英文译名 CSI (第1季) (2000首播)CBS. 本季看点:<犯罪现场调查>赌城拉斯维加斯吸引着做发财梦的人,也吸引着形形色色的罪犯,该市警察局的犯罪现场调查局在全美国名列第二.该剧 ...

  2. 【每日新闻】谷歌CEO皮查伊:AI会拯救人类,而不是摧毁 | 致远互联签约锤子科技

    每一个企业级的人  都置顶了 中国软件网 中国软件网  为你带来最新鲜的行业干货 小编点评 不能因为害怕风险 就避免开始 我们喜欢用现状去预测未来 其实未来远比预测精彩 期待AI 期待AI给我们带来的 ...

  3. 泰州市区首次试用“闯红灯人脸识别系统”;“冷扑大师”想用AI提高肾脏移植效率 | AI掘金晚报

    泰州市区首次试用"闯红灯人脸识别系统":"冷扑大师"想用AI提高肾脏移植效率 | AI掘金晚报 本文作者:李晓利 2017-08-06 20:10 导语:泰州市 ...

  4. 【华人学者风采】查正军 中国科学技术大学

    [华人学者风采]查正军,中国科学技术大学大数据学院教授.主要从事图像视频分析与检索.多媒体大数据分析.计算机视觉.人工智能等方向的研究.累计发表学术论文百余篇,其中ACM/IEEE汇刊论文及CCF推荐 ...

  5. AI产品经理能力模型的重点素质:人文素养和灵魂境界

    本文是我第一次正式详述"人文素养和灵魂境界"对于AI产品经理的意义到底在哪里,摘自<AI产品经理的实操手册(2021版)>的1.1.3.3节. 在AI产品经理的能力模型 ...

  6. 【心灵鸡汤】浪子助你提高解决问题能力

    为什么80%的码农都做不了架构师?>>>    今天我们聊聊开心的话题 :) 我们都知道无论在什么行业,学习能力才是发展的最重要的,用潜力来说也可以. 但是学习能力是什么,其实很虚, ...

  7. 创新奇智AI商业化落地能力彰显,完成逾4亿元A和A+轮融资...

    从天使轮到A和A+轮,一路走来,创新奇智交上了一份令投资人和市场满意的成绩单. 2019年1月24日,创新奇智宣布2019战略及最新融资进展,完成总金额逾4亿人民币的A轮和A+轮融资.本轮融资由中金甲 ...

  8. 浪潮发布重磅产品“元脑”,专注AI全栈能力输出

    整理 | 一一 出品 | AI科技大本营(ID:rgznai100) 4月16日,以"智慧凝聚"为题的IPF2019浪潮云数据中心合作伙伴大会在上海举办.大会重点聚焦浪潮" ...

  9. 近期活动盘点:高管AI大数据能力研修班、英伟达初创企业展示开启报名

    想知道近期有什么最新活动?大数点为你整理的近期活动信息在此 高级管理人员AI大数据能力研修班 截至2020年12月31日 项目背景 大数据是第四次产业革命的核心,物联网.人工智能.5G通信.区块链.数 ...

最新文章

  1. 某程序员吐槽:提离职后领导开始演戏,假装不知道我工资低,对我进行挽留,怎么办?...
  2. LeetCode Scramble String
  3. cfb为什么不需要填充_为什么很多高中生数学成绩不理想,需要补课?因为不熟练啊!...
  4. SENet(Squeeze-and-Excitation Networks)
  5. 不同编程语言的取模运算%
  6. 【模拟】【codeforces】599B Spongebob and Joke
  7. 15必须阅读Java 8教程
  8. linux pcie命令,setpci命令_Linux setpci 命令用法详解:查询和配置PCI设备的使用工具...
  9. NSTimer--转
  10. Android常用代码混淆模板
  11. Struts2请求处理流程及源码分析
  12. tensorflow代码中的一个bug
  13. 安装brew_MacBook Pro安装Homebrew慢的问题解决方案
  14. python 提取邮箱的正则表达式
  15. 1.11 Linux压缩和解压文件
  16. 应考虑字节顺序(大小端问题)的几种情况
  17. (已更新)外卖侠3.10.27版本外卖+售卖影票+任务功能微擎版本程序源码下载
  18. 什么是面向对象对象,什么是面向过程,什么是面向对象思想。
  19. Java程序员职业规划
  20. 【阮一峰ES6入门教程学习笔记】函数的扩展

热门文章

  1. 中国码农在硅谷:告诉你如何斩获Google、微软、FB、Airbnb 四家 Offer
  2. Java程序员必会!没有返回值的构造函数是怎么完成赋值的?
  3. mysql重置密码报错,吐血整理
  4. java语言基础教程课后答案,积累总结
  5. python r语言接口_R语言,python接口rpy2安装的问题
  6. 点云特征图离散化_点云采样
  7. Android开源aria使用,1.1 开始
  8. matlab 直方图 肥尾,概率分布细谈:厚尾、长尾、幂律、指数
  9. java命令javac java,使用命令行JAVAC编译Java
  10. java中三种方法_Java文件I/O的三种方法