在刚刚落幕的冰雪赛事中,百度智能云曦灵为央视新闻打造的AI手语主播正式上岗,她以流畅、专业的手语服务实时传递冰雪运动的激情。然而在日常生活中,听障人士想要方便地获取信息仍面临着众多困难,无障碍窗口稀缺的问题亟待解决。

3月3日,百度智能云曦灵正式发布“AI手语平台”,可实现分钟级生成手语合成视频、手语主播实时直播等能力,为手语服务普及的难题提出了科技新解法。同时百度智能云曦灵还发布了“AI手语平台一体机”,可以通过规模化部署快速建立无障碍窗口,插电即用、操作简单,适用于医院、银行、车站等多种公共场合,缓解无障碍窗口短缺困境。

百度集团副总裁吴甜表示,人工智能呈现融合创新和降低门槛的新特点,综合运用多技术的数字人带来新体验,AI加持使数字人制作和运营成本与门槛降低,AI手语平台将让更多听障人士享受科技带来的便利。

百度集团副总裁吴甜

AI手语平台+一体机,随时随地构建“无障碍窗口”

目前我国听力语言残疾人达到2780万以上,而专业的手语翻译不足1万人,巨大的需求缺口亟待补足。

在国家发布的《无障碍环境建设“十四五”实施方案》中,明确提出要完善无障碍基本公共服务体系、加强信息无障碍服务深度应用。百度智能云曦灵此次发布的“AI手语平台”及“AI手语平台一体机”,可以轻松在线上线下不同场景中快速实现手语翻译服务,助力无障碍环境的建设。

针对线上场景,“AI手语平台”具备“视频手语合成”、“直播手语合成”、“文本转手语”、“语音转手语”四大功能,只需几小时的部署,即可实现普通视频合成为手语视频、实时直播中增加手语画面、文字翻译为手语、语音实时翻译为手语等多种效果。AI手语平台可搭载在各类APP、网站、小程序中,让听障人士也能轻松实现线上社交、娱乐休闲、课程学习等各类需求。

对于诸如医院、银行、机场等线下场景,一体化产品的优势正在逐渐放大。百度智能云曦灵此次发布的全离线一体机V3以及端云结合一体机P3,搭载了“AI手语平台”的核心功能,可实现ASR语音识别、语音翻译、人像渲染等多功能,让“AI手语平台一体机”像手机、电脑一样可快速、批量的生产,并渗透到生活的各个角落。

未来通过“AI手语平台一体机”即可将普通服务窗口直接转换为“无障碍窗口”,听障人士在医院可轻松实现挂号、看诊、缴费、取药等全系列流程,在车站、机场可独立完成值机、托运、改签、中转,在法院、警局等特殊场景中也可对各类紧急情况进行实时平等的沟通。

 高可懂度手语表达的背后,是技术的创新与沉淀

和传统翻译相比,手语翻译过程更为复杂,主要在于手语翻译并非按照日常说话的顺序逐字翻译,而要根据语句意思进行语言精炼和语序调整。手语是真正的小语种,数据量难以支撑训练,各类场景声学环境复杂难部署,还需要唇语及表情的配合辅助理解,对AI手语平台的构建提出层层挑战。

想实现高可懂度的AI手语能力要解决三大技术点:语音识别的清晰度、手语翻译的准确度、手语动作的流畅度。在经过开幕式、赛事播报等重重考验,AI手语主播也印证着“AI手语平台”已成功解决这三大难题,以行业领先的全链路AI能力实现“听得清”、“翻得准”、“打得好”的手语服务。

首先,在语音识别清晰度上,百度智能云曦灵-AI手语平台通过SMLTA语音识别算法模型,实现声学、语言一体化端到端建模语音识别,在手机端近场语音识别率可达98%以上。百度语音技术部总监高亮表示,基于百度自研的深度学习算法,还可针对诸如旅游、医院、司法等不同领域的词准率进行针对性训练,词准率可达96%,使得AI手语平台一体机更好地应用于不同场景中。

(百度语音技术部总监高亮)

其次,在手语翻译的准确度及精炼度上,百度人工智能技术委员会主席何中军表示,百度研发了首个基于神经网络的精炼度可控手语翻译模型,并联合手语语言学专家、特殊教育专家以及天津理工大学聋人工学院等制定了自然手语标注规范,建设了大规模自然手语翻译语料库,使得模型可以从真实数据中学习手语翻译知识,比如语序的调整、词语的映射以及长度控制等,从而生成符合听障人群习惯的自然手语。

百度人工智能技术委员会主席何中军

天津理工大学聋人工学院副院长袁甜甜在发布会上分享到,聋人学生更能感同身受,不错过每一个细节。由于时间紧任务重,学生们还自发呼吁其他各高校近五百名聋人学生共同完成语料库的标注,以责任感和荣誉感为弥补社会信息鸿沟做出努力。

(天津理工大学聋人工学院副院长袁甜甜)

最后,在手语动作的流畅度上, AI手语平台通过“动作融合算法”, 基于《国家通用手语词典》规范精修近11000多个手语动作,让每一个动作的起落之间自然衔接,带来真人手语般地连贯性表达。再配合4D扫描技术训练,使得AI手语数字人表情自然生动,口型生成准确度高达98.5%。

无障碍环境建设直接决定着残障人士的生活质量,也是国家及社会文明的标志。百度智能云曦灵“AI手语平台”及“AI手语平台一体机“的发布,将快速解决各类场景中无障碍窗口稀缺的问题,助力社会文明及美好生活的持续构建。

听障人士的“有声桥梁”:百度智能云曦灵-AI手语平台发布相关推荐

  1. 唯一杰出级!百度智能云曦灵获信通院权威认证

    ​中国信通院公布"数字人系统评测结果" 百度智能云曦灵平台 继首批通过48项基础能力评测后 在第二轮性能分级评测中 以超高分获得行业唯一"杰出级"证书 代表了当 ...

  2. 首批通过!百度智能云曦灵平台获信通院数字人能力评测权威认证

    近日,中国信通院云计算与大数据研究所.内容科技产业推进方阵等机构共同发布数字人2022年首批内容科技评测结果.百度智能云曦灵数字人平台顺利通过技术能力.工程化能力.安全保障能力三大维度测评,成为首批获 ...

  3. 直播24小时不间断:百度智能云将推出AI超高精数字人

    据悉,在7月21日百度世界2022大会上,百度智能云将推出数字人直播平台,可实现超写实数字人24小时纯AI直播,支持随意切换妆发.服装.场景. 相比真人主播,数字人直播可降低人.时间.空间的限制,无需 ...

  4. 百度智能云开物工业互联网平台解决方案亮相2021服贸会成果发布会

    9月3日,在2021中国国际服务贸易交易会(以下简称"服贸会")成果发布活动上,百度智能云开物工业互联网平台全价值链解决方案首次发布.这不仅能降低企业的信息化建设成本,而且能将人工 ...

  5. 百度智能云专有云多云管理平台解决方案荣获《可信云多云管理平台解决方案》权威认证

    日前,百度智能云专有云一体化多云管理平台通过信通院<多云管理平台解决方案>认证,在多云接入.异构纳管.资源管理.服务编排.运维监控等方面获得国家权威机构认可. 百度智能云专有云一体化多云管 ...

  6. 云计算2020,百度智能云加速推进AI与产业深度融合

    2020年,一场突如其来的疫情席卷全球.在全国.乃至于全世界共同抗疫的大背景下,云计算市场却迎来了新的发展机遇. 一.2020,变化中的云市场和云需求 春节假期结束,产业领域逐渐复工以来,线上办公成了 ...

  7. 百度智能云“千帆大模型平台”最新升级:接入Llama 2等33个模型!

    今年3月,百度智能云推出"千帆大模型平台".作为全球首个一站式的企业级大模型平台,千帆不但提供包括文心一言在内的大模型服务及第三方大模型服务,还提供大模型开发和应用的整套工具链,能 ...

  8. 百度智能云 x 立思辰 | AI+大语文,让白居易现场教学成为可能

    文字描述很难感知?文章读起来晦涩难懂?学习语文有没有更好的方式? 如果白居易亲自教你<卖炭翁>,讲解唐朝当时的官制.进士发展的历史,你会不会兴趣大增?如果李白亲自举杯邀你共饮美酒,共话盛唐 ...

  9. 3.9亿听障人士的福音,这款APP帮他们 “听见”世界

    硅谷Live / 实地探访 / 热点探秘 / 深度探讨 电影<我不是药神>最近大热.影片反映了高价进口药让许多患者无力购买的现状.观影后,小探不禁在朋友圈发出了"在现实社会,别穷 ...

最新文章

  1. android NDK JNI设置自己的log输出函数
  2. linux c 文件指针 句柄(FILE*) 文件描述符(fd) 文件路径(filepath) 互相转换
  3. 数据存储之属性列表Plist
  4. Integer与int的种种比较你知道多少?[转]
  5. MSF(二):msf外部/内部常用命令
  6. Java怎么使用spring定时器_浅析spring定时器的使用
  7. 计算机网络技术中的数据通信
  8. 导出文件_一招解决PDF文件导出图片
  9. Nuc972使用NandFlash时,uboot所需要的改动
  10. 求第i个小的元素 时间复杂度O(n)
  11. linux下的shell多线程用法,shell多线程操作
  12. 弹出框之对话框和提示框,可共用代码
  13. mysql正删改查返回值_MySQL增删改查
  14. BASH 进阶(转载防丢)
  15. UEFI中的Fd文件
  16. putty怎么更改为中文_Putty怎么样设置显示中文 设置Putty显示中文
  17. linux下通过ping命令监控网络抖动脚本
  18. cosh和acosh--双曲余弦和反双曲余弦函数
  19. 【Computer Organization笔记08】指令系统概述,指令格式,寻址方式
  20. UVa 12096 The SetStack Computer 【STL】【stack】

热门文章

  1. x230 linux wifi,笔记本thinkpad x230i centos6.3 无线网卡完全配置
  2. (原創) Altera Technology Roadshow 2011 Taipei (SOC) (Quartus II) (Nios II) (Qsys)
  3. 离线安装k8s 1.9.0
  4. NginxApachePHP参数汇总
  5. zookeeper集群环境搭建
  6. ORACLE11g 没有控制文件如何通过rman备份恢复数据的详细实战过程
  7. ASP.NET MVC4中调用WEB API的四个方法
  8. Python全栈开发day2
  9. centos7 install 安装mysql
  10. 人生曲线——我们不拥有将来,只拥有此刻