对话系统的思想也许自计算机科学领域产生以来就存在了。我们无从得知Charles Babbage在19世纪30年代发明分析机和差分机的时候是否已经思考过这个问题;但是我们可以明确地知道,Alan Turing在1950年的论文《计算机与智能》中介绍图灵测试时就定义了终极对话系统。

维基百科 – 图灵测试的“标准定义”,C(询问者)通过问题来判断A和B谁是人,谁是机器。为做出判定,询问者仅限于使用书面问题来回复。

Turing曾预测机器最终能通过图灵测试,到2000年,30%的询问者在5分钟的测试中可能会被愚弄。未来学家Raymond Kurzweil在1990年将这个期限更改为2020年;2005年时又做出修改,期限推至2029年。

最后的这个预测跟先前的一样,对我而言都是不确定的,不过很多有趣的对话系统先于预测的年限就已经得以开发,市场并不需要通过图灵测试才开始采用对话系统。

Turing Test version 3.png

聊天机器人与对话管理的根本区别:

谈及对话系统自1950年以来的历史之前,考虑过去几十年中两个不同的趋势是极为重要的:一个是外观模拟对话(称其为聊天机器人方式),一个是模拟真实的对话,并动态产生合适答案(称其为对话管理方式)。在图灵测试的定义中我们可以直接发现这两种方式共存的原因,因为图灵测试仅重视所提供答案的感官的有效性,而不去验证回答是否基于理解。

现实中,开发出来的系统有时结合这两种方式,但是其中一个总是明显地占主导地位(在一定程度上,我们可以说聊天机器人里有对话管理,即使它通常基于简单的模式匹配规则)。以下给出一个简例以示说明:

用户询问:“你能给我买一瓶牛奶吗?”

利用对话管理方式,计算机可以(只是举例)创建一个模型:[type:Question; action:buy;interrogation:ability to perform action;object:bottle of milk]。基于这个模型,系统可能利用相当复杂的知识作参考来回答问题,例如,“不行,因为我没有钱”,或者可能提问:“可以考虑,不过你能给我一些钱吗?”。

对于聊天机器人方式,这个内部处理是不存在的,而是通过相当简单的规则选择预定义答案(”你能…..?” => 列表选项 ["当然可以", "我不能", "不行, I我不想买"])。在列表中被随机挑选的答案可能是合情理的,但是,系统并没有真正理解问题,而只是假装能够执行对话。

如果目的是执行一个真实的动作而不仅仅是提供一个答案(系统在假装理解用户问题的前提下怎么能作出有意义的反应呢?),我们很容易理解聊天机器人方式根本不合理。对文本会话来说也是如此。因为聊天机器人的局限性太大,即便只是回答问题,它们也无法提供任何可持续的价值。

不过,一个良好演示实例的效果是巨大的,在过去的50年中,大多数人们被错误的想法欺骗,认为自由的对话系统能利用聊天机器人方式有效地工作。令人失望的是,大量金钱白白浪费,更令我绝望的是,在可预见的将来,还会有更多的金钱被浪费在这上面。可以预见,直到对话管理能够提供充足的结果来完全根除计算机科学发展中令人羞耻的错误,这种无谓的浪费才会停止。

聊天机器人的历史:

一切自Joseph Weizenbaum于60年代在麻省理工学院(MIT)开发Eliza开始,它被认为是第一个聊天机器人。Eliza最有名的程序是DOCTOR script,它模仿在最初的精神病面谈中非定向精神治疗师的答复。具有讽刺意味的是,即使产生于人们身上的情感反应使Weizenbaum相信系统有极大价值,但他从未把它看作是智能系统。不仅如此,Eliza引发的众多毫无意义的争论和错误的结论,促使他编写《计算机的动力与人类理性:从判断到计算》这本书,书中指出滥用人工智能将可能降低人类生命的价值。与其阅读这本书,人们更喜欢摆弄Eliza,正如希腊神话中的皮格梅隆(Pygmalion)(更具讽刺意味的是Eliza的名字来源于此),Weizenbaum无法控制自己的创造。即使没有任何科学依据人们也愿意相信聊天机器人的潜力,它们将继续存在。即使众多历史案例提醒我们,基于匹配模式的系统注定是要失败的。50年后,许多公司仍试图说服人们购买它们。

6年后,即1972年,精神病医生Kenneth Colby在斯坦福大学(Stanford University)创造了PARRY。它的基本原理与Eliza一样,但是Parry模拟的是妄想型精神分裂症患者,而不是心理治疗师。即使Colby做出了更多的努力,其结果是完全相似的。可以想像,人们把Eliza(心理治疗师)与Parry(精神分裂症患者)不可避免的联系在一起,在此提供两者1972年在ICCC相结合的结果。任何人都可以猜测到两个愚蠢聊天机器人的对话的结果如何……

计算机程序Racter(来自William Chamberlain 和Thomas Etter的著作The Policeman’s Beard Is Half Constructed》)也未能在人工智能领域凸显优势。其结果令人印象深刻,但是该程序从未向公众发布。一年后,Mindscape发布Ractor的聊天机器人版,人们明白Ractor远远没有The Policeman’s Beard一书中所写的那么复杂。这个事件至今仍然充满谜团,但显而易见的是Chamberlain 和 Etter创建了包含书中大部分文字内容的大量数据文档,Ractor只是把它们“联合”在一起。

早在1978,Michael Mauldin是试图将推理引入聊天机器人的第一人。他创造的PET聊天机器人能设想新信息,并由于如下对话而闻名:

Subject: 我喜欢我的朋友。

(later)
Subject: 我喜欢食物

PET: 我听说食物是你的朋友。

随后,Mauldin创造了虚拟人物(即现在的Conversive)和两个有名的聊天机器人:Sylvie (1994) 和 Julia (1997)。除了加入动画和合成语音,由Maulding 和Peter Plantec (另一个创造者)提供的重要方面是有能力探索收集一个虚拟世界的信息(如:网站),并在对话中使用收集的信息。从这个意义上讲,Mauldin试图打开一条模式匹配方式的出路,从而实现从外部获得知识,而不是象ELIZA那样采用预格式化的数据文档。另一个有意义的方面是,Mauldin同样也是Lycos搜索引擎的创造者,Lycos最初是Julia的衍生。Mauldin在1994年还发明了术语——聊天机器人(人工会话实体的同义词)

始于1990年的罗纳奖(Loebner Prize Contest)是一个年度人工智能竞赛。奖励那些在图灵测试中“最像人类”的聊天机器人。罗纳奖不需要基于模式匹配方式的对话系统,所以,到基于推理的系统运作的那一天,它们将能竞赛中证明其能力。这个竞赛只看结果,通过随意的聊天对话,并评估结果。该竞赛不关心方法论,所以获奖的系统一定是能快速提供结果的,并非是一次性就花费大量精力试图解决问题的一些小方面。

聊天机器人历史中另一个重要人物是Richard Wallace,A.L.I.C.E(人工语言互联网计算机实体)的创始人。Wallace采取不同的方法,使Alice三次获得罗纳奖(2000年,2001年,2004年)。他回归到一种纯模式匹配的方法,为具体说明启发式的会话规则,他创造了一个名为AIML(人工智能标记语言)的XML Schema语言。这种方法的优势在于能容易地在一个AIML文档中创建和共享知识,以及把多个AIML文档加载到一起组成一个“更聪明的”机器人。

所有付诸于基于模式匹配的聊天机器人的工作都是对时间和金钱的巨大浪费(我们将看到,浪费将达数亿美元)。你不相信的话就试用一下Eliza,并将其与2008年的罗纳奖获得者Elbot相比较,然后再来判定这50年的努力是否值得。我们探究的领域正确吗?

商界中的聊天机器人:

聊天机器人应用于商业的平均寿命期限仅为6个月。

Forrester 研究

关于大型公司如何相信聊天机器人的潜力,其中最有趣的故事是Artificial Life。它成立于1994年,向诸如Credit Suisse First Boston, Price Waterhouse Coopers and UBS这样的公司出售定制的聊天机器人应用。该公司还在运营,且运营情况相当良好,只是现在涉及的领域(手机游戏)完全不同以往。互联网业泡沫经济过后,他们或多或少失去了原有的市场。

有意思的是,这个公司1998年在纳斯达克(NASDAQ)(ALIF)上市,2000年2月其市场资本的股票价格达到每股38美元。2003年6月,股票价格仅为0.05美元,少于3年前的760倍。公司的股票为38美元时,其市值达18亿美元。3年后,市值不足250万美元。

Artificial life不是唯一的失败案例,却是有史以来的最具影响的。其CEO Eberhard Schoneburg由于在聊天机器人领域中创造了惊人金钱价值令人钦佩,虽然历时短暂;更有甚者,Schoneburg的成功之举在于将公司移至香港,最总转型为手机渗透率位居世界第二的手机游戏公司。

另一个有名的例子是Ask Jeeves公司(即现在的Ask.com),1998年它说服Dell采用“Ask Dudley”来作为在线技术支持。Ask Jeeves充分利用其自然语言能力及基于聊天机器人的技术,2000年的销售额达5800万美元。1999年公司股票每股高达190美元,之后公司股票开始急剧下降,到2002年每股跌至86美元。受困于拥有的技术不具备良好运行所必需的功能,Ask Jeeves通过购买名为Teoma Technologies的搜索引擎公司找到了一条出路。2005年,公司宣布逐步淘汰Jeeves。2006年2月27日,Jeeves从Ask.com上消失了。

然而,与聊天机器人领域中的一般情况相比,这两个例子都显示出在销售上的巨大成功,大多数情况下,无法证明他们的安装和运营成本是否合理。

“大多数德国的机器人由无偿资金开发。”

引用于“源自德国的趋势:数字参考中的程序库机器人”

基于模式匹配的聊天机器人技术理念,其方法和基本原则本身就阻碍了该技术的发展和有效性……事实上,虚假的但却具有某种外观形式的人工智能可能在市场上大肆行销……但是利用假象向客户提供仅有有限价值的新“功能”,即使这种方法存在,历史已经证明它的兴起到失败历时非常短暂……

对话管理的历史

以推理为基础,与聊天机器人相反,对话系统试图控制更多而做得更少。事实上,它们的实施案例往往集中于需要特定动作的特定领域。即使对话管理市场上尚未受到像聊天机器人那样的广泛关注,它们的历史也颇具趣味。

参考关于IBM“针对手势界面的对话管理”一文,对话管理于1986年被真正使用。当然,之前也做过许多工作,但都未将对话管理器作为一个独立模块使用。

卡内基梅隆大学(CMU)是过去20年中最活跃的研究中心之一,尤其是自1999年Wu & Rudnicky创建的对话管理器AGENDA以来。2003年,Bohus & Rudnicky创造了RavenClaw,它是CMU架构的语音对话系统,即现在奥林巴斯对话系统结构的标准对话管理器。

这种架构带来了惊人的的效果,不仅仅局限于对话管理器的范围,还贯穿于整个对话系统流程(语音识别、自然语言处理、对话管理、输出生成、语音合成)。RoomLine application在我看来, 虽然未立足于市场,但是仍然具有很大潜能。

商业领域中的对话管理

聊天机器人在随意的文字聊天中找到一席之地的同时,对话管理器朝有声环境方面渗入,但首先,我们需要一个标准:AT&T, IBM, Lucent和Motorola(1999年3月形成VoiceXML论坛),以便为描述语音对话开发一个标准的标记语言。他们于1999年发布了VocieXML 0.9标准,随后是2000年的1.0版本和2003年的2.0版本。

由此激发之下,该领域已经向语音识别方向推进,许多大型公司崛起,如全球领导者Nuance。公司于1992年成立,现在市值35亿美元。尽管他们的大部分产品与语音识别和文件管理有关,基于对话管理的生产线,是其极具价值且日益增长的收益来源。

未来:

没人知道基于模式匹配的聊天机器人什么时候才能找到其市场地位,也不知道需要多少案例才能让市场最终明白这个方式的局限性。

另一方面,对话管理的热潮尚未到来,希望它能达到像聊天机器人那样的高度。在CMU所做的工作中,对话管理系统的最初潜力已经显现出来。这些技术有效占领市场只是时间的问题。

为提供更好的搜索、更好的用户界面和更好的用户体验,很多公司,诸如Guidyu,正在应用超越语音应用范围的对话管理技术进行着另一场有趣的革新。

http://www.sylvainpaillard.com/wordpress/?page_id=284

对话系统的历史(聊天机器人发展)相关推荐

  1. 聊天机器人发展及应用技术解析

    本文介绍聊天机器人原理及实现傻瓜式聊天机器人. 1 聊天机器人简介 维基百科 聊天机器人(也称为聊天机器,聊天机器人,Bot,IM bot,交互代理或人工对话实体)是通过语音或文本进行对话的计算机程序 ...

  2. 直面聊天机器人(一)

    随着机器学习(Machine Learning, ML).深度学习(Deep Learning,DL)等技术体系的发展以及大数据体量和质量的不断提升,人工智能(Artificial Intellige ...

  3. 2021-2027全球与中国BFSI中的聊天机器人市场现状及未来发展趋势

    本文研究全球及中国市场BFSI中的聊天机器人现状及未来发展趋势,侧重分析全球及中国市场的主要企业,同时对比北美.欧洲.日本.中国.东南亚.印度等地区的现状及未来发展趋势. 本文重点分析在全球及中国有重 ...

  4. 聊天机器人技术分析综述

    研究背景及发展现状 1950年图灵(Alan M. Turing)在<Mind>上发表文章<Computing Machinery and Intelligence>,文章开篇 ...

  5. 聊天机器人系统的组成结构及关键技术

    通常来说,聊天机器人的系统框架如下图所示,包含五个主要的功能模块.语音识别模块负责接收用户的语音输入并将其转换成文字形式交由自然语言理解模块进行处理.自然语言理解模块在理解了用户输入的语义之后将特定的 ...

  6. 直面聊天机器人(三)

    本篇内容将简要分析聊天机器人的发展历史以及在某段历史中的代表性产品.虽然聊天机器人技术随着近年来人工智能的发展而持续演进,但事实上在人工智能大潮出现之前已经诞生了一些聊天机器人产品.为了让读者能够全面 ...

  7. 智能聊天机器人小黄鸡及其制作方法

    讲前先预热一下,如果有还不熟悉小黄鸡的亲~欢迎大家戳这里 http://mysimi.sinaapp.com/ 自制小黄鸡一枚,欢迎测试.. 暂且叫他小黄鸡2号~1号在后面哈 大家好,我是沐儿,今天很 ...

  8. 基于tensorflow的聊天机器人

    ** 基于tensorflow的聊天机器人 ** 基于Tensorflow的聊天机器人,主要基于机器深度学习,采用seq2seq+Attention模型,先由jieba中文分词框架对汉字文本语句分词再 ...

  9. 智能聊天机器人技术研究与应用

    文章大纲 1. 聊天机器人简介 聊天机器人进化历史 聊天机器人核心技术 2. 预训练模型与聊天机器人研究进展 transfomer 架构回顾 预训练对话模型 case 1 :个性化对话生成 case ...

最新文章

  1. js、jquery相关的操作
  2. mysql插入大量数据总结
  3. C++通过vmware.exe检测虚拟机
  4. ITK:优化简单的抛物面函数
  5. ef 数据迁移mysql_07116.3.0如何将CM的外部PostgreSQL数据库迁移至MySQL服务
  6. 五中高考2021成绩查询,全市2021届高三第二次模拟考试成绩分析会在开封五中胜利召开...
  7. window 2008+apache2.4.4+php5.5+mysql-5.6.12+phpmyadmin4.0.4.1安装过程(参考他人文章基础上加上自己遇到的问题)...
  8. OpenCV中将RGB数组在内存中压缩成JPEG文件
  9. strike F1 to retry boot,F2 for setup utility
  10. ML — 浅谈聚类和分类的区别
  11. 菁搜FTP搜索引擎 photo2
  12. SCCM 2016 远程协助工具
  13. RCC_APB2Periph_AFIO时钟一般在什么时候下需要开启?
  14. 二进制反码求和java_有趣的二进制-浮点数
  15. 计算机用word做海报,【2人回答】电脑Word怎么做海报?-3D溜溜网
  16. 深度学习之美 第五章 学习笔记
  17. 经典英文歌曲,爆好听!
  18. 第三方支付(微信支付)支付流程分析
  19. 一个优秀IT专家的成长历程---献给所有的颓废或即将颓废的人们
  20. python 语法基础篇

热门文章

  1. sql+php修改mysql结构,MSSQL_修改SQL-SERVER数据库表结构的SQL命令附sql命令行修改数据库,具体不废话了,请看下文代码 - phpStudy...
  2. 发明专利和实用新型专利
  3. CASS坐标导入并展点显示
  4. 联想电脑不显示蓝牙开关该如何操作
  5. Table options do not contain an option key ‘connector‘ for discovering a connector.
  6. 【人工智能与机器学习】——Keras编程分别实现人脸微笑和口罩数据集的识别模型训练和测试(卷积神经网络CNN) + 实时分类微笑和口罩识别检测
  7. 中小型企业搭建数据团队的踩坑分析
  8. shell脚本中的expectsend(周末不加班神器)
  9. 道路积水监测、城市道路积水监测系统、路面积水监测系统—西北某省会城市案例分享
  10. Java高级之线程同步