人类对唇语的学习和研究由来已久,然而由于受经验、视线以及主观因素的影响,人类解读唇语的正确率存在不稳定性。因此让AI学会“读唇术”,在很多应用场景都有着现实意义。

读唇是一种特别难的技能,人们在读唇的时候会尽可能多地根据话语间的联系来判断,读唇人本身的语言知识也至关重要。AI“读唇术”简单来讲就是一项唇语识别技术,计算机通过进行视觉识别和自然语言处理,来分析说话人的唇部运动,从而识别出说话内容。

牛津大学计算机系开发出了一个名为LipNet 的人工智能系统。据报道,这个人工智能的系统是建立在一个被称为“GRID” 的数据集上。该研究团队使用这个数据集来训练人工智能的神经网络,经常用它进行语言识别。随着时间的推移,AI 的神经网络识别的嘴型也越来越多,慢慢地它就会理解他所识别到的信息。AI 不会仅仅识别断断续续的画面,相反,它会根据整个演讲的大意来整合它所识别到的信息。它会自动分析句子根据上下文来理解整个演讲的大意。

近几年,海云数据、搜狗等国内多家企业也相继发布唇语识别技术。唇语识别技术在公共安防、军事情报和公益等多个领域都能发挥巨大的作用。

一套成熟的唇语识别系统需要大量的人脸特征样本数据,这些数据要尽可能包含更多场景、更多类型的说话人,以此保证训练出来的唇语识别模型具有更好的泛化能力。

AI展现唇语识别能力,大数据功不可没相关推荐

  1. AI 时代,还不了解大数据?

    来自:IT人的职场进阶 如果要问最近几年,IT行业哪个技术方向最火?一定属于ABC,即AI + Big Data + Cloud,也就是人工智能.大数据和云计算. 这几年,随着互联网大潮走向低谷,同时 ...

  2. 当AI黑科技撞上大数据日:清华大学第四届大数据日成功举办

    春风送暖,万物芳华,清华大学迎来了她107岁生日:值此之际,清华-青岛数据科学研究院(以下简称"数据院")在2018年4月26日C楼前广场举办了主题为--"AI黑科技进清 ...

  3. 近期活动盘点:AI Time:论道AI安全与伦理、大数据、AI在中国金融保险业的应用案例分享讲座...

    想知道近期有什么最新活动?大数点为你整理的近期活动信息在此: AI Time"science debate 论道AI安全与伦理 2019年5月31日 如今,人工智能的社会角色不断更新迭代,越 ...

  4. 90%人工智能公司都亏损?AI盈利难背后的大数据门槛

    AI落地场景在不断增多,但赚钱依旧艰难. 根据亿欧报告显示,2018年全年,近90%的人工智能公司处于亏损状态,而10%赚钱的企业基本是技术提供商.从谈概念.讲技术,到拼场景.抢落地,建立在大数据基础 ...

  5. 面向唇语识别的数据采集系统

    本文主要是分享一下自己在探索设计实现一个面向中文唇语识别数据采集系统的经验.主要有两步工作,一是配置系统环境,  二是系统设计与编程实现. 1.对于环境系统配置,主要包括格式工厂.爱剪辑软件的安装,V ...

  6. 京东又有AI科学家加盟:加拿大大数据教授裴健入职,向刘强东汇报

    李根 发自 凹非寺  量子位 报道 | 公众号 QbitAI 又一位AI背景科学家加盟京东. 京东今日宣布,加拿大一级研究讲座教授(大数据科学领域).加拿大西蒙弗雷泽大学计算科学学院教授.统计与精算学 ...

  7. 滴滴出行推出AI Labs,全面开启大数据的行车智能时代

    滴滴出行日前宣布成立AI Labs(人工智能实验室)以加大人工智能前瞻性基础研究,吸引科研人才,加快推进全球智能交通前沿技术发展. 滴滴出行日前宣布成立AI Labs(人工智能实验室),以加大人工智能 ...

  8. 读后感系列4:《人工智能》-李开复-第二章《AI复兴:深度学习+大数据=人工智能》

    这一次人工智能复兴最大的特点是,AI在语音识别.机器视觉.数据挖掘等多个领域走进了业界的真是应用场景,与商业模式紧密结合,开始在产业界发挥出真正的价值. 第三次AI热潮:有何不同? 1.场景& ...

  9. 淘宝总裁为何是蒋凡?大数据功不可没

    [数据猿导读] 2017年12月27日,阿里巴巴集团在员工公开信中宣布,任命集团副总裁蒋凡出任淘宝总裁. 为何是年纪轻轻的蒋凡? 记者 | 小北 官网 | www.datayuan.cn 微信公众号I ...

最新文章

  1. java integer int 比较_java Integer和int之间的比较问题是什么?
  2. 1024,千家公司程序员幸福指数大比拼!最“幸福”的程序员是你吗?
  3. 概率论 第四章 随机变量的数字特征
  4. Python之二叉树的遍历
  5. controller调用controller的方法_SpringBoot 优雅停止服务的几种方法
  6. 论文审稿人可以下岗了?CMU都做出论文审稿机器人了!
  7. 成员函数的重载,覆盖与隐藏
  8. 中小企业用户如何选择简单进销存软件?
  9. 如何使用ELK来监控性能
  10. [转载] Python Web开发—进阶提升 490集超强Python视频教程 真正零基础学习Python视频教程
  11. 将文字或txt转换成GBK或者UTF8编码
  12. c语言 链表_小陈的C语言笔记---链表(详细讲解基本操作和概念)
  13. nyoj-78-圈水池(Graham算法求凸包)
  14. Redis 3.2.4编译安装
  15. mysqld mysql-debug_mysqld --debug-sync
  16. h264和h265解码上的区别
  17. 关于Nand Flash行地址和列地址的计算
  18. 博客园公告栏增加每日一言功能
  19. 官方MySQL解压版安装说明
  20. Kubespray安装kubernetes

热门文章

  1. 贴片功率电感封装尺寸与性能
  2. 一. 卡尔曼滤波器开发实践之一: 五大公式详解
  3. windows系统下更新nodejs
  4. 无损播放器Linux系统,Ubuntu Linux下支持无损CUE的音乐播放器——Qmmp
  5. 图片转JPG格式怎么转换
  6. Android系统判断CPU是32位还是64位
  7. vue文件流导出excel表格打不开
  8. Vagrant 介绍
  9. 大数据智慧交通项目【完整资料】
  10. 杰理之关于608n省晶振模式使用PWM_LED的注意事项【篇】