点击上方蓝字 关注网易智能

为你解读AI领域大公司大事件,新观点新应用

【网易智能讯7月2日消息】在谷歌I/O开发者大会召开的一个月后,谷歌召集了几位记者在曼哈顿召开会议。对Google这家世界上最大的公司之一来说,这是一个不同寻常的地方。桌子被移出,为九把椅子腾出空间,共计三排,每排三座,面对着一个巨大的、明亮的显示器。旁边,四名谷歌员工坐在临时控制中心的办公桌后。Duplex在推出时曾引起广泛讨论与争议,Google公司终于准备好提供一种对Duplex更深入的解读。

这家舒适的纽约餐厅对这类活动来说意义非凡,因为Google公司拉开了基于人工智能预订服务的帷幕,餐厅的老板坚持认为,这样的服务对于每天多达100多个预约的餐厅来说,真是天赐之物。对谷歌来说,显然是时候为这一AI系统的设计目的和背后的运作方式提供更多的“透明度”了。

CEO桑达尔·皮查伊(Sundar Pichai)展示的简短演示,引出的问题远比其回答的要多。众多观点开始涌现,探讨了这一AI系统所能带来的技术道德问题。 Duplex AI 系统可以实现逼真的拟人效果,让企业相信其在和一个人说话。

“Duplex ”代表着一个罕见的早期投射,主导这个正在进行中的项目的公司因似乎谨慎地策划着什么行动却隐藏自身意图而声名狼藉。然而,信息披露是关键。就像自动驾驶汽车一样,需要严格的现实测试来消除系统中的所有问题。

谷歌公司今天在一篇博客文章中写道:“虽然我们还没有广泛发布这一功能,但我们正在分享更多关于这项技术的信息,以提供透明度和鼓励反馈,重要的是,我们要为员工和企业提供正确的体验,而且我们正在采取一种缓慢而有分寸的方式,因为我们在测试中加入了学习和反馈。”

谷歌这一过程的性质很可能会以某种方式出现,因此I/O大会上的宣布有双重目的,其一是为了让自己站在这一叙述的前面,其二是在该公司最大的舞台上呈现一个雄心勃勃的项目。皮查伊(Pichai)在主题演讲中说:“你将听到的是谷歌助理打给一家真正的美发沙龙店来进行预约。”

“嗨,我打电话来是为了预约一个女士理发项目。

嗯...我希望定在5月3日。”

——谷歌助理

“当然,给我一秒钟。”

——接待员

“嗯...嗯。”

——谷歌助理

在这里,观众们都笑了,起初难以置信。紧接着给予掌声。我们很难相信,我们听到的只是谷歌人工智能助手的一个纯自动化版本。“嗯...嗯(mm-hm)”的语气词是锦上添花——这是一种微妙的声音,透露出谈话还在进行中以及带有使谈话更自然的延迟。

语言学中所谓的“言语障碍(speech disfluencies)”,是语言中正常的、常见的部分,也是使Duplex成为一种非凡产品的秘密武器的关键部分。除此之外,它们是系统的一种礼貌的变通方式。

例如,如果Duplex在要求为5人的派对预订房间后面临不确定的回应,那么它将会以微小的变化重申:“嗯,5个。”这能解决接线人员的潜在困惑,同时也将一种微妙的语言标记包含在内,为谈话提供了进一步的真实感。

这些元素是Duplex工作中的一个非常真实的部分。至于在大屏幕上播放的两个演示,实际上,它们是真实的。更有趣的是,该公司表示,在电话发出后,它通知了企业,似乎为这一过程提供了额外的真实性。

目前,“ Duplex”仍然是一项正在进行中的项目。此外,该系统还没有在早期提供信息披露,这一事实可能违反了在康涅狄格州、佛罗里达州、伊利诺斯州、马里兰州、马萨诸塞州、蒙大拿州、新罕布什尔州、宾夕法尼亚州、华盛顿州和谷歌所在的加州总部等地记录电话和通话的“双方同意(two-party consent)”规定。

新闻自由记者委员会技术与新闻自由项目主管Gabe Rottman说:“在这里,从一开始到现在的问题,不仅仅是Duplex的问题,还涉及到机器语音的更广泛的法律意义。”如果这项服务扩展到所有方的同意状态,或者在全球范围内,你可以看到问题出现,比如,如果你不知道来电者是一台机器,同意是否有效。像这样的难题将会成倍地增加我们进入恐怖谷的次数,在那里,自动语音可以作为人类语音传递。”

展望未来,该系统将局限于那些法律使其可行的州。这也适用于州际电话,只要双方都能被覆盖。谷歌助理副总裁尼克·福克斯(Nick Fox )说:“我们想要确保它的运作方式受法律规定的约束。”尽管披露的信息还没有出现,但该公司从一开始就表示打算将这些信息添加进去。然而,这种动机并不是因为法律后果,而是常见的机器人/人类礼仪。

谷歌公司在一篇博文中写道:“谷歌Duplex技术的建立的目的是为了让对话听起来自然,让对话的体验感达到舒适。”“对我们来说,用户和企业对这项服务有良好的体验,这一点很重要,而‘透明度’是其中的关键部分。我们想要清楚地了解通话的意图,以便企业了解上下文。我们将在未来几个月里试验正确的方法。”

在媒体的追问下,这种“透明度”最终将会是什么形式,Google公司的一位发言人后来补充说,“我们理解并重视围绕谷歌Duplex的讨论——就像我们从一开始就说过的那样,技术的透明度很重要。”我们正在设计这一功能,并内置了信息披露功能,我们将确保系统被正确识别。我们在I/O大会上展示的是一个早期的技术演示,我们期待着在开发产品的过程中加入反馈。”

从目前的形式看,这是很有意义的:

“嗨,我是谷歌助理,打电话来给客户做一个预约。”这个自动调用将被记录。

“ Duplex”并没有透露它是人工智能的事实——但如果你对谷歌助理有一定的了解,你就可以把这部分整合到一起。但是,它确实让你知道电话正在被记录。谷歌将这些对话记录下来,用于文本处理和质量保证目的,因此谷歌公司可以继续修改和完善系统。

在我的测试电话中,我试图让Google助理重复这一段——很容易就能听到这句开场白,尤其是当你把手机放在一个拥挤的餐厅里时。但是人工智能只是在预定的情况下继续使用。如果你错过了信息披露,你就没那么幸运了——至少现在是这样。目前,选择不被记录的唯一方法就是挂断电话——这显然不是获得回头客的最佳方式。

谷歌助理副总裁Scott Huffman解释说:“我们确实有一种机制,它会说‘好吧,我不会记录你的语音’。我认为我们仍在搞清楚在这里做什么是正确的。退出是正确的吗?基本上把录音去除?”就像其他所有人在那天做演示一样,我尽我最大的努力把这个系统关掉。助理要求预订在下午6点。我告诉它我们要到11点才开门——这是曼哈顿。助手礼貌地结束电话——或者像谷歌所说的“退出”。

这里“努力想得到却永远无法获取的”是试图用图灵测试从Duplex找出欺骗之处。如果你成功了,谷歌的一个人工操作员将会采取相应的控制。这些人工操作人员是Duplex测试的一个重要组成部分,谷歌表示,他们计划以某种形式将其保留在未来,以确保事情永远不会失控。最终将会有多大的群体还有待观察。

在我们的简短聊天中,我们的小组中没有人成功地调用了一个真实的人,尽管我们对系统的局限性有一些重要的见解。例如,当被要求“重复最后四个数字”时,它会完整地重述电话号码。这并不是一个缺陷,但它确实显示了一个简单的地方,即系统在理解人类对话微妙的细微差别时,被推到了它的极限。

另一方面,当被问及用户的电子邮件地址时,系统只是简单地说,它没有获得“客户”的许可来公开这些信息,以此来维护整个“助理”关系。谷歌表示,在测试中,该系统也会因使用电话树(交互语音应答系统)而遇到另一台机器。仔细地听,因为我们的菜单选项已经改变了,现在还没有计算出来。

目前,谷歌表示,Duplex能够完成五项完全自动化的任务。百分之八十是相当不错的,但是Google正在努力使事情变得更好。“我们希望确保我们不会浪费公司的时间,”福克斯说。“我们想要确保我们在这里所做的每一件事,这对企业来说是一种很好的体验,而且当他们试图经营自己的业务与助理交谈时,他们不会感到沮丧。”

正如在/O大会中所宣布的,更多的测试将在今年夏天开始。而在“未来几周”,下一轮将会是助理展开对营业时间的询问。在接下来的几个月里,它将扩展到餐厅预订和美发沙龙的预约。与在I/O大会上的演示不同的是,将会出现“一组有限的受信任的测试人员和选择的企业”,他们将会参与其中。

到目前为止,企业似乎都渴望加入。正如谷歌在今年4月进行的一项客户调查所显示的,“60%依赖客户预订的小企业没有建立在线预订系统。”

对于那些不想接电话的用户来说,Duplex提供了一个令人信服的替代方案。对于这些企业来说,这意味着增加更多的潜在客户。另一方面,那些因为各种原因而不愿加入的人,将能够通过他们的谷歌商业清单(假设他们有一个)而选择退出。如果你使用,客户可以用谷歌助手预订。另外,通过偶尔调用来确认你的详细信息,以快速更新你的清单。

谷歌的负责人介绍,自从Duplex开始成为一款临时拼凑的演示程序(在MacBook上小心翼翼地放置了一款办公电话)以来,这个系统已经走过了很长一段路。Duplex是通过语音到文本、文本到语音的复杂组合和谷歌自己的WaveNet音频处理深层神经网络来运作的。早期的演示并没有像一些人猜测的那样存在,但实际上它们是真实的——而且事情只会变得更令人印象深刻。

不管你喜不喜欢,Duplex很快就要来了,唯一能阻止它的办法就是挂断电话。

选自:techcrunch

作者:Brian Heater

编译:网易智能

参与:nariiy

- 加入社群吧 -

网易智能AI社群(AI专家群、AI黑板报)火热招募中,对AI感兴趣的小伙伴,添加智能菌微信 kaiwu_club,说明身份即可加入。

消除恐惧回应指责 谷歌再次深入解读引发争议的AI打电话相关推荐

  1. 计算机博士谷歌要吗,计算机博士指责谷歌科学欺诈 遭遇网友批驳

    昨天在韩国首尔进行的谷歌"阿尔法围棋"与人类代表 李世石的"人机大战"五番棋第2局较量,阿尔法执黑中盘完胜李世石,以2比0领先,李世石再度受到沉重打击,已输得没 ...

  2. 苹果、FB和谷歌都准备解读情绪 它们打算怎么做?

    2月14日消息,外媒VB报道称,苹果公司上月收购了创业公司Emotient,后者可利用人工智能技术(AI)对人们的面部表情进行分析以解读其情绪.而这意味着,除了Google和Facebook,另一科技 ...

  3. 谷歌研究员走火入魔事件曝光:认为AI已具备人格,被罚带薪休假,聊天记录让网友San值狂掉...

    梦晨 发自 凹非寺 量子位 | 公众号 QbitAI 谷歌研究员被AI说服,认为它产生了意识. 他写了一篇长达21页的调查报告上交公司,试图让高层认可AI的人格. 领导驳回了他的请求,并给他安排了&q ...

  4. 罗永浩宣布退网创业;谷歌研究员“走火入魔”事件曝光:认为AI已具备人格,被罚带薪休假;Wasmer 2.3 发布|极客头条

    「极客头条」-- 技术人员的新闻圈! CSDN 的读者朋友们早上好哇,「极客头条」来啦,快来看今天都有哪些值得我们技术人关注的重要新闻吧. 整理 | 梦依丹 出品 | CSDN(ID:CSDNnews ...

  5. 2500万美元和AI专家!谷歌出钱出人,要用AI做“对社会有益”的事情

    晓查 发自 凹非寺 量子位 报道 | 公众号 QbitAI 今天凌晨,谷歌宣布拿出2500万美元资助一些对社会有益的AI项目,叫做"AI for Social Good".顾名思义 ...

  6. 谷歌语音识别功能Live Transcribe,让AI帮助语言障碍者“说话”

    原标题:谷歌语音识别功能Live Transcribe,让AI帮助语言障碍者"说话" 目前,全球有4.66亿人患有残疾性听力损失.而据世界卫生组织估计,到2050年,这一数字将超过 ...

  7. linux 微信不能发图片,微信回应发原图泄露位置信息​;元旦起 AI 造假音视频不得随意发布...

    原标题:微信回应发原图泄露位置信息​:元旦起 AI 造假音视频不得随意发布 参考:开源中国.solidot.cnBeta.腾讯科技.快科技等 0.网信办等三部门联合发布新规:明年起,AI 造假音视频不 ...

  8. 谷歌研究员Francois Chollet:有良知的AI研究人员不应该在Facebook工作

    文章来源:ATYUN AI平台 本周,由于剑桥Analytica公司的丑闻,Facebook受到了很多批评,其中一个令人意想不到的批评来源:谷歌.谷歌研究员Francois Chollet在周四发布的 ...

  9. ICLR2020全析解读:华人学者占据60%,谷歌再次领跑!(附最新高引华人榜单)...

    关注上方"深度学习技术前沿",选择"星标公众号", 资源干货,第一时间送达! 来源:学术头条 ICLR 全称为 "International Conf ...

最新文章

  1. Linux(centos6.0)下安装Node.js以及使用
  2. 第十章 基本数据结构——栈和队列
  3. new和malloc的区别
  4. python 遍历元组例子_【Python入门自学笔记专辑】——元组的创建、访问、遍历...
  5. mysql raiserror_RAISERROR在SQL Server数据库中的用法
  6. 中国石化行业节能减排行业发展动态与运营前景规划展望报告2022年
  7. 模仿探探的左右滑动切换卡片功能
  8. Linux 创建网页服务,Linux使用Node.js建立访问静态网页的服务实例详解
  9. 【C语言】两个乒乓球队进行比赛,各出三人。甲队为a,b,c三人,乙队为x,y,z三人。已抽签决定比赛名单。有人向队员打听比赛的名单,a说他不和x比,c说他不和x,z比,编写程序找出三对赛手名单。...
  10. java tomcat 日志分析工具_设计一个Tomcat访问日志分析工具
  11. 负数如何归一化处理_「译」 对比归一化和标准化——量化分析
  12. 【BZOJ1823】 [JSOI2010]满汉全席
  13. Request header field mytoken is not allowed by Access-Control-Allow-Headers in preflight (请求头设置问题)
  14. 网络拓扑 令牌环网 以太网_以太网连接中网络拓扑的类型及其框架 以太网技术...
  15. BZOJ 4199 品酒大会
  16. Code Review流程
  17. Firefox默认英文修改中文
  18. html 带箭头的提示框,css实现对话框-带箭头提示框
  19. Gram矩阵及其实际含义
  20. RBF-UKF径向基神经网络结合无迹卡尔曼滤波估计锂离子电池SOC(附MATLAB代码)

热门文章

  1. 视频动态,一个被微信遗忘的功能
  2. I am trying
  3. J2EE学习从菜鸟变大鸟之四 JNDI(Java Naming and Directory Interface)
  4. 还不知道音频格式转换mp3软件哪个好?进来看看就知道了
  5. 如何得知深睡眠等各类进程的函数堆栈 -- DW-SW等
  6. 工控软件——驱动框架
  7. linux添加阵列后看不到home下文件,Vmware Esxi 6.7设置阵列卡直通后找不到存储踩坑总结...
  8. 为什么宇宙的年龄是130亿年,我们却能看到470亿光年远?
  9. 【中间件技术】第三部分 Java企业版规范与中间件(8) EJB 构件开发
  10. 常见加密分类以及接口sign签名