Otter.ai创始人Sam Liang:智能记录你的生活对话
Robin.ly 是立足硅谷的视频内容平台,服务全球工程师和研究人员,通过与知名人工智能科学家、创业者、投资人和领导者的深度对话和现场交流活动,传播行业动态和商业技能,打造人才全方位竞争力。
本期Robin.ly创业专访邀请到语音识别和转录初创公司Otter.ai的CEO和创始人Sam Liang(梁松)和大家分享他的创业经历和对自然语言处理的见解。
Sam Liang于2003年取得斯坦福大学的电子工程博士学位,并曾经是谷歌地图定位服务的核心团队成员。他的第一家创业公司移动定位平台Alohar在2013年被阿里巴巴收购。
Sam Liang在硅谷接受Robin.ly专访
以下为精彩内容节选
长按二维码或点击“阅读原文”
访问Robin.ly观看完整英文访谈视频
1
早年经历
Wenli: 您在斯坦福获得了电子工程的博士学位。入学的那一年,您的校友Marc Randolph创办了Netflix。您有没有想过有一天也会像他一样成为一名企业家?
Sam Liang:
我在斯坦福主要是从事软件方面的研究。我的导师是计算机科学领域的知名教授,叫David Cheriton。他为Larry Page和Sergey Brin写了第一张十万美元的支票,帮助他们在1997年创办了谷歌。后来这十万美元变成了几十亿美元,造就了历史上最成功的天使投资之一。
刚去斯坦福的时候我并没有创业的念头,但接下来的几年在创业环境中受到熏陶,也开始有了创业的想法。于是毕业后我加入了一家创业公司,想要了解和学习创业公司是如何运作的,想着有一天能创办自己的公司。
Sam Liang与导师David Cheriton
(图片来源:Sam Liang)
Wenli Zhou: 您曾经在Google担任过平台架构师。您觉得在Google的那几年最大成就是什么?
Sam Liang:
我在2006年加入Google,负责打造一个城域WiFi系统。那时候还没有3G,使用移动设备连网十分困难。Google决定在市内的路灯上安装路由器来提供WiFi服务,这也是我加入Google后参与的第一个项目。后来Google又推出了定位服务,我编写了这个项目的第一行代码,还设计了整体的架构。
2007年,Steve Jobs推出的第一款iPhone其实并没有任何GPS功能,于是我们最先为iPhone建立了定位服务,并得到了Jobs本人的肯定。当这款服务在旧金山推出时,乔布斯亲自在iPhone上进行了演示,而我在后台全程负责确保演示的顺利进行。这是一段很难忘的经历,对我后续的创业也很有帮助。
Sam Liang在Google Maps时期
(图片来源:Sam Liang)
2
Otter.ai 的特点和优势
Wenli Zhou: 能介绍一下Otter.ai吗?它跟其他语音识别产品有什么差别?
Sam Liang谈Otter.ai的产品优势
Sam Liang:
我们打造出Otter.ai只花了三年时间,这是一个基于人工智能和深度学习的语音识别产品。一开始很多人会好奇,已经有了Siri和Alexa,我们为什么还要打造一个类似的产品。实际上,我们的产品有自己的特点,针对的是一个完全不同的市场,满足的是不同的需求。因为我们知道,用同样的产品跟那些大公司直接竞争几乎没有什么胜算。
多数人每天与Siri或者Alexa对话的次数和时间都很短,而市场上也没有记录和分析这些对话的工具。然而,谈话是人们日常沟通最常见的方式。如果有一种方式可以记录人们生活中的所有对话,是不是很有意思呢?比如如果我与风险投资人,潜在客户以及求职者的对话能够被记录下来,对我来说是很有帮助的。但最重要的是,人工智能可以分析对话的内容,并提供一些建议。这就是我们打造Otter的目的。
Otter是一款可以在iPhone上使用的免费产品,也可以在浏览器上使用。不到一年前,我们推出了Otter的语音识别服务,随后这个产品很快流行起来,几个月前还被Google评选为2018年最佳应用程序。最近的一次TechCrunch Disrupt San Francisco大会也使用Otter作为整个会议的官方语音应用程序,实时转录所有演讲和谈话的文本,并在会场及通过直播进行展示。这是该会议的语音技术十几年来第一次得到更新。
Sam Liang在TechCrunch大会
(图片来源:Sam Liang)
Otter的 AI 技术包括语言识别和声音识别两部分。语言识别能够将歌曲和谈话转换为文本;声音识别,或说话人识别,能够识别是谁在说话。其中还包括了一个叫做人声分离(diarization)的技术。人声分离是一种区分不同人声音的技术,可以通过声音来辨别某人的身份。一旦检测到一个人的发言,系统就会为该发言者创建一个声纹配置文件,从而分辨同一个人其他所有的语音。
Wenli Zhou: 目前语音识别的准确度是多少?您觉得这个技术将来还会有哪些应用?
Sam Liang谈语言识别技术未来的发展方向(兼Otter App展示)
Sam Liang:
对于母语人士来说,准确率可能会达到95%,如果背景噪音比较大就会低一些。
能够识别不同人的声音实际上可以帮助我们更好的理解对话。因为即使是相同的句子,不同的人想表达的意思很可能也不一样。通过查看历史记录就有可能理解同一个人的说话习惯,并分析出以后各种表达的真实含义。会议笔记之类的活动记录将来也可以由Otter或其他类似的AI系统完成。我们的所有语音记录都会加密保存,也可以有选择的进行分享。我们还可以通过关键词搜索历史记录,比如说话人的姓名和“自动驾驶汽车”这样的话题。
3
Otter的主要合作伙伴
Wenli Zhou: 我知道Otter目前是Zoom的唯一合作伙伴,帮助他们转录所有的视频会议文本。你们现在还在跟其他企业合作吗?
Sam Liang:
首先,Zoom是一个很好的合作伙伴,他们专门授权我们的系统提供自动转录服务。Zoom是目前世界上最热门的视频会议系统,实际上也是第一个提供自动语音识别,自动转录的会议系统——没错,不是Google,不是微软,也不是WebEx。所以这给我们的产品和服务质量加分不少。
Sam Liang与Zoom创始人Eric Yuan
(图片来源:Sam Liang)
除了Zoom,我们还有很多其他合作伙伴。其中一个可以公开介绍的是由Ray Dalio创建的桥水基金。它是世界上最大的孵化基金,管理着1600亿美元。Ray Dalio非常提倡公司运作要保持较高的透明度。桥水基金记录了过去近20年的所有会议内容,在观看了我们的产品演示之后就决定使用Otter进行会议记录和分析。
我们还有一部分合作伙伴是大学。很多学生和老师用Otter记录讲义或教师会议。比如加州大学洛杉矶分校正在考虑开展一种针对国际学生的服务,帮助他们记录课堂笔记。实际上我早年来美国的时候也经常听不懂教授讲课,只能使用录音笔把整堂课录下来,课后还要反复听才能理解授课内容。有了Otter这样的工具,可以为留学生带来很多方便。
4
Otter的发展前景
Wenli Zhou: Otter在2016年从几家风险投资公司筹集了A轮融资。您会经常跟投资者沟通吗?他们会影响公司决策吗?
Sam Liang:
我们经常跟投资者交流,比如Tim Draper和Horizons Ventures。他们是打造了AlphaGo的DeepMind公司的早期投资者,也投资了Waze和Spotify这样的炙手可热的公司。
Sam Liang(右)与Robin.ly主持人Wenli(左)
我们会跟投资者开诚布公的讨论,让他们充分了解我们的想法。他们通常相信我们会做出最好的决定,也会在适当的时候提供建议。他们对我们的技术,我们的团队和整个市场都充满信心。这些投资人往往经验丰富,能够对未来5-10年的市场状况做出合理的预测。这样的判断可以帮助我们提早行动,甚至赶在Google,Amazon和苹果等大公司意识到之前就抢占新市场。新的创业公司往往就是这么诞生的。当然,可能其中99%最终都会失败,但幸存的那1%就会变得非常成功。(完)
相关阅读
天使投资人Jim Scheinman:Zoom的诞生始末
Mosaix首席科学家劳逆:弱监督学习是未来发展趋势
IEEE Fellow何晓冬:让客服不再冰冷
流利说AI刘扬:从教授到”AI虚拟老师“
“文人相轻”:论初创团队倾轧问题
你“在看”吗?
Otter.ai创始人Sam Liang:智能记录你的生活对话相关推荐
- Nature封面:IBM团队发布“AI辩论家”最新研究进展、Insitro创AI制药领域单笔融资金额记录 | AI日报...
AI制药公司Insitro完成4亿美元的C轮融资,创AI制药领域单笔融资金额记录 近日,AI制药公司Insitro宣布完成 4 亿美元的 C 轮融资,成为全球 AI 制药领域单笔融资金额最高的公司.本 ...
- 地平线发布AI on Horizon战略,边缘AI芯片开放赋能智能驾驶
解读AI on Horizon的商业理念和智能驾驶战略,宣布和首汽约车.禾赛科技的重磅合作--车展上的地平线"很忙". 4月16日至25日,以"共创•美好生活" ...
- 地平线发布AI on Horizon战略,边缘AI芯片开放赋能智能驾驶...
解读AI on Horizon的商业理念和智能驾驶战略,宣布和首汽约车.禾赛科技的重磅合作--车展上的地平线"很忙". 4月16日至25日,以"共创•美好生活" ...
- Stability AI 创始人:大模型不应该只属于巨头
作者 | 凌梓郡 编辑 | 靖宇 追溯 ChatGPT 引发的 AI 军备竞赛,可以回到去年 7 月,图像生成模型 Stability Diffusion 开源(下文称 SD).这个在 Open AI ...
- Jina AI 创始人肖涵博士:揭秘 Auto-GPT 喧嚣背后的残酷真相
Auto-GPT 究竟是一个开创性的项目,还是一个被过度炒作的 AI 实验?本文为我们揭开了喧嚣背后的真相,并揭示了 Auto-GPT 不适合实际应用的生产局限性. 背景介绍 这两天,Auto-GPT ...
- AI空前火爆,“智能时代”真的到来了吗?
AI可谓是热度空前.自从"阿尔法狗"完胜了围棋顶尖高手之后,关于AI的谈论就一直都未停歇.贴着AI标签的项目犹如雨后春笋般涌现,与AI也许有关的公司的股价更是一路看涨. 但是,对于 ...
- 维智科技AI驱动的银行智能决策
近日,在上海市经济和信息化委员会.上海市科学技术委员会等的共同指导下,2022年首期"In+hub"创新社区加速营成功举办,维智科技凭借"数据+AI"驱动的银行 ...
- 【AI简报20210827期】AI芯片逐步落地智能教育硬件市场!用AI设计芯片会成为未来趋势吗?...
嵌入式AI硬件 1. 集成全球最大AI芯片,Cerebras发布全球首个人类大脑规模的AI解决方案 原文: https://new.qq.com/omn/20210826/20210826A06VH9 ...
- (2017年11月)天池医疗AI大赛肺部结节智能诊断在线分享
观看目的: 看看3年前的DL技术和当今技术(2020年9月脊柱病变检测),到底有多少进步. 感受参赛选手的思维方式. 总结和收获 竞赛要"快糙猛"的先出第一版结果,然后去在各个环节 ...
最新文章
- 独家 | 如何利用大规模无监督数据建立高水平特征?
- 项目展示文案生成设计
- QQ“远程协助”文字输入技巧
- LiveData ViewModel 使用详解
- linux screen 进程,screen 命令使用
- 【HDU - 1083 】Courses (二分图)
- 教程 | Hadoop集群搭建和简单应用
- 剪切caspase3_caspase-3
- python求矩阵维度必须一致_python数据分析(二)--Numpy
- db15接口各针脚示意图_【沙发管家】带你了解 HDMI 接口的用处都有哪些?
- java itext word_Java使用iText生成word文件的解决方案 | 学步园
- SGX技术与SGX攻击
- Hyperledger Fabric定制联盟链网络工程实践
- 神经元图片结构图,人脑神经元图片
- 商业智能bi是什么意思?
- 接力队选拔matlab,这是我见过的操作最好的接力队之一= =
- leetcode 最常见的150道前端面试题(简单题下)
- 六自由度工业机器人 机械手臂 3D2D结构图纸 工业机器人
- 这个发现是否会是RSA算法的BUG、或者可能存在的破解方式?
- unity2D学习(10)创建敌人、为敌人编写简单的AI
热门文章
- ft232rl可以了
- quectel(调用相关命令)7
- Unity用UnityWebRequest和 BestHttp的GET和POST表单提交,与php交互
- 恭喜你,未来的CISSPer,你需要知道的背书全流程和小秘密
- 目标检测框架网络模型分析(二 双塔奇兵)
- Jenkins 添加Allure报告 并发送企业微信通知
- 为什么IPv6显示无网络访问权限
- Yolo-v4的CSPNet(Cross Stage Partial Network)
- 晶圆在低温探针台中的安装方式——GE Varnish
- microPython驱动tft屏幕显示中文终极解决方案