文章来源:ATYUN AI平台

Facebook语音计算革命的速度有点慢。它没有语音助手,它的智能扬声器仍在开发中,而像Instagram这样的一些应用程序并没有完全配备音频通信。但根据在Facebook代码中发现的实验,再加上新的专利申请,情况可能有所改变。

据报道,它即将推出的Portal智能音箱专为与家庭远程视频聊天而设计,包括老年人和可能遇到手机问题的孩子。改进的转录和语音到文本到语音转换功能可以将Messenger用户连接到输入媒体上,并将它们保留在聊天应用程序上,而不是偏向于短信。

鉴于Facebook已经迟了一步,它需要通过强大的实用程序来解决实际问题。以下是Facebook在语音领域的最新发展,以及它过去的实验如何为其下一次重大推动奠定基础。

Aloha

Facebook正在以Aloha为名开发自己的语音识别功能,用于Facebook和Messenger应用程序,以及外部硬件,可能是它正在开发的视频聊天智能扬声器。在Facebook和Messenger的Android应用中,移动研究人员Jane Manchun Wong第一次看到了Aloha用户界面的原型。

精彩视频点击原文:Facebook的语音助手Aloha疑曝光

Aloha语音测试中,当用户在消息线程中说话时,水平蓝条会扩展和收缩,以便在识别和转录到文本时可视化语音量。该代码将该功能描述为与外部Wi-Fi或蓝牙设备建立连接。该软件可能会在Facebook的硬件和软件上运行,类似于在手机和Google Home扬声器上运行的谷歌智能助理。

多年前,Facebook有兴趣开发自己的语音识别软件,专门用于准确转录朋友之间的互动方式。与我们正式处理亚马逊Alexa或Google Home等计算机助理的方式相比,这些语音模式通常更随意,口语化,快速且充满俚语。

Wong还在Facebook的代码中发现了Aloha徽标,其中包含火山图像。有人在Facebook员工的手机上看到了一个Facebook Aloha Setup聊天机器人,上面有类似的标志。

如果Facebook可以解决这个问题,它可以在Messenger和网站的其他地方提供自己的转录功能,这样用户就可以跨媒体进行通信。它可能会让你无法查看屏幕时向朋友发出评论或消息。然后,接收者可以阅读文本而不必像语音消息那样收听它。该功能还可用于为Facebook应用程序的语音导航提供动力,以实现更好的免提使用。

智能音箱Portal

Facebook的视频聊天智能音箱最初代号为Aloha,但后来更名为Portal,Business Insider的Alex Heath和现在Cheddar于2017年8月首次报道。由于担心会加剧剑桥分析公司引发的隐私丑闻,它被推迟了。

一项新的专利申请显示,Facebook正在考虑建立一个智能音箱,早在2016年12月26日,它就为立方体形状的设备申请了专利。该专利描绘了由Baback Elmieh,Alexandre Jais和John Proksch-Whaley 发明的“音箱的装饰设计”。Facebook于当年9月收购了Elmieh的创业公司Nascent Objects,现在他是Facebook秘密的Building 8硬件实验室的技术项目负责人。

通往Voicebook的漫长道路

Facebook长期在语音领域进行修整。2015年,它收购了自然语言处理初创公司Wit.ai,该公司运行了一个用于构建语音界面的开发者平台,但后来将Wit.ai推入Messenger的平台团队,专注于聊天机器人。Facebook也开始测试在2015年自动将Messenger语音片段转录成文本,这可能是上面看到的Aloha的基础功能。

第二年,Facebook负责人David Marcus声称“这不是我们现在正在积极开展工作的事情”,但他补充道,“在某种程度上,很明显,随着我们在Messenger中开发越来越多的功能和交互,我们将开始处理语音交换和接口。”然而,一位消息人士称Facebook的秘密语言技术小组已经在探索语音机会。Facebook也开始为想要播放声音而不是视频的用户测试其实时音频功能。

到2017年,Facebook为Pages的视频提供自动字幕,并正在开发语音搜索功能。今年,Facebook开始尝试将语音片段作为状态更新和故事,这些用户可能难以用母语打字。但高管们并未谈及语音举措。

最详细的评论来自Facebook的设计负责人Luke Woods,他在TechCrunch Disrupt 2017描述了语音搜索,说它“非常有前途”。

目前还不清楚Facebook的Aloha究竟会怎样。对于Facebook的智能扬声器和应用程序,它可以是操作系统或语音界面和转录功能。它也可能会像M一样成为一个更加成熟的语音助手。或许它可能成为Facebook与其他语音生态系统的桥梁。

更多语音识别数据集点击“这里”下载

本文转自ATYUN人工智能媒体平台,原文链接:Facebook的语音助手Aloha疑曝光

更多推荐

英特尔收购可编程芯片设计商Omnitek,增强可视化处理和AI推理功能

波士顿动力机器狗大军来袭!十只机器狗拉动卡车,即将投入商用

CapeAnalytics:使用人工智能和地理空间图像向保险公司、再保险公司提供与野火相关的信息

Facebook AI可将音频中的人声在歌手间进行转换

欢迎关注ATYUN官方公众号,商务合作及内容投稿请联系邮箱:bd@atyun.com

Facebook的语音助手Aloha疑曝光相关推荐

  1. Facebook语音助手Aloha细节曝光,它的logo竟然是一座小火山?

    郭一璞 发自 凹非寺  量子位 报道 | 公众号 QbitAI 屡次跳票后,传了一年多的Facebook语音助手Aloha终于有下文了. 喜欢"八卦"尚未发布的科技产品的推特博主J ...

  2. Facebook开发AI语音助手,或是“钱途”未卜

    雷锋网注:[ 图片来源:Gizmodo  所有者:Chip Somodevilla/Getty ] 即便Facebook近年来多次深陷舆论漩涡,但在科技创新方面,它从来不会缺席. 昨天凌晨(北京时间) ...

  3. Facebook最新语音算法曝光!自监督语音识别,错误率低至2.43%

    2019-11-06 15:16:55 智东西11月6日消息,Facebook近日公开自动语音识别(ASR)领域的wave2vec机器学习算法细节,可以使用原始音频作为训练数据并提高准确性. wave ...

  4. 三星语音助手曝光 将与Galaxy S8一同发布

    导读 三星的AI语音助手已经曝光,名字叫做Bixby,将与三星旗舰手机Galaxy S8一同推出,根据SamMobile网站周一收到的韩国版Samsung Pay的测试页面截图,三星即将推出的AI语音 ...

  5. Meta 开发 AI 语音助手,用于创建虚拟世界和实时翻译

    编译 | 禾木木 出品 | AI科技大本营(ID:rgznai100) Meta 在近日的「用人工智能构建元宇宙」的讨论会上,展示了最新的 AI 黑科技 「Builder Bot」 ,并且在此次会议上 ...

  6. 语音助手再次敲响隐私保护警钟

    来源: 中国科学报 智能手机内置的语音助手已成为人们生活中的亲密伙伴,大家习惯于让它完成报时.查询天气等日常任务甚至与它聊天解闷.然而,近期多家科技公司被曝光以智能语音助手录制用户谈话,再通过人工对语 ...

  7. 嘘!你与谷歌语音助手的对话,可能已经泄露……

    要闻聚焦 1.你与谷歌语音助手的对话,可能已经泄露-- 2.外媒看中关村:正在改变中国,谋求改变世界 3.网约车司机行车途中玩手机.剪指甲,滴滴:已暂停其服务账号 4.改名大法好:瑞安航空将波音737 ...

  8. 如何退订语音包_怎么关闭语音助手 - 卡饭网

    如何在高德地图上关闭语音助手? 如何在高德地图上关闭语音助手? 不论高德地图还是百度地图都有语音助手这一功能,语音助手不仅可以给我们播音导航,甚至还可以提醒我们路况情况,但是有时我们想要关闭语音助手, ...

  9. Chimaera:用区块链游戏思维将《玩家一号》的“绿洲”变为现实;网易有道将推语音助手及智能音箱

    区块链资讯 1.Chimaera :用区块链游戏思维将<玩家一号>的"绿洲"变为现实 据外媒报道,一家名为 Chimaera 的平台正在通过区块链游戏的形式将目前热映的 ...

最新文章

  1. Yii2.0 连接数据库
  2. MongoDB中_class字段的作用
  3. Angular (Full App) with Angular Material, Angularfire NgRx 第3章 21节
  4. 小米武大共建人工智能实验室,先期提供1000万研发经费
  5. 分享一个debian系统优秀的镜像源
  6. 多层陶瓷电容器用处_元器件用法:多层陶瓷电容器的用途
  7. 全国计算机b类一级考试试题题库,全国计算机等级考试模拟题:一级B试题(一)...
  8. 微软MSDN原版所有系统合集我告诉你,Windows历史操作系统索引
  9. Flask深度学习模型服务端部署
  10. 计算机usb接口电压不稳定,如何处理笔记本电脑USB接口的电源不足或电压不稳定?...
  11. 计算三角形的周长和面积
  12. html设置控件坐标,html表格按钮位置调整 html中怎样改变表格的位置
  13. VBA - 粘贴为数值型
  14. 2019-11 前端技术汇总
  15. FTP主动模式和被动模式详解
  16. Burp Suite测试小程序,设置代理之后手机一直连不上网
  17. L1-2 h0053. 游戏时间 (5 分)
  18. c语言汇编语言在线转换,如何把汇编语言转换成C语言
  19. 靶机渗透-----DC-2
  20. 电工搜题软件哪个好用?试题难不难?

热门文章

  1. 12月3日DAMA-CDGA/CDGP数据治理认证考试报名
  2. 编译原理【词法分析】—LR(0)、SLR(1)、LR(1)、LALR(1)文法之间的关系
  3. android 程序图标隐藏
  4. 解决wps工作簿从文本中复制粘贴时单元格中首位0无法显示
  5. 关于mmsplayer一些电台不支持播放问题说明
  6. 关于性开放引发的一些思考
  7. STEAM的前世今生
  8. 倾角传感器在工业领域的应用
  9. win11怎么开启3d游戏加速功能?
  10. stdlib.h和stdio.h有什么区别