编者按:微软研究院年度内最大的节日——微软技术节(TechFest 2012)近期隆重开幕。本届技术节以“自然人机交互”和“大数据”为焦点,微软亚洲研究院带去了近40项最新技术,其中“将单一语言的文语转化变为混合语言”项目就是与数据交互的典型。下面就让我们一窥究竟,看看如何从大数据中提炼大智慧吧!

(图片来自于互联网)

在技术节上,来自微软亚洲研究院的近40项创新技术获得了来自微软产品部门和各界嘉宾的关注。微软亚洲研究院院长洪小文博士表示,“作为微软在海外最大的基础研究机构,微软亚洲研究院始终坚持通过技术创新推动整个计算机科学领域的发展,并帮助改善人们的计算体验。我们希望能有更多微软亚洲研究院的创新成果转化到微软产品中,加速实现这些激动人心的计算体验。”

在微软亚洲研究院展示的技术中,“将单一语言的文语转化变为混合语言”技术可利用一名说话人的单一语言录音合成出不同语言的训练语料库,以此构建统计模型的多语言的文语转换系统;“高保真面部动画捕捉”技术充分利用最先进的动作捕捉技术和3D扫描技术,以获取具有逼真的动态皱纹和精细的面部细节的高保真3D面部表情;“城市地区建筑物自动解析”技术能够让用户仅凭一张图像就能展开市区3D之旅;“Windows Phone 和Kinect上的语言学习游戏”则侧重于如何在不同微软产品平台上获得愉快的“寓教于乐”的语言学习体验。下面就让我们来看看其中三个精彩的项目吧!

将单一语言的文语转化变为混合语言

语音用户界面需要利用文语转化(text-to-speech)合成语音技术来“说出”语音合成的另一种语言,有时人们甚至希望用混合的不同语言来表达。例如,一个人在国外,而他并不熟悉当地语言,这时如果导航仪能够用混合语言的模式发出指令,就会很方便,也就是说,导航仪指令能够将街道名称等专有名词以当地语言的形式表达,而路线方向则用这个人的母语来表达。混合语言文语转化要求用户能够同时标准说出这两种语言,但是通常这样的人才很难找到。

该项目展示了一种新方法,可将用户所说的话翻译成另一种语言播放出来,并保留用户自己说话时所具有的口音、音色和语调,听起来就像本人亲自说的一样。微软首席研究官里克•雷斯特演示了这款软件的功能,他说了一段英语,然后利用这款软件把这段话翻译成了西班牙语、意大利语和中文普通话播放了出来。结果,这三种语言的发音听起来非常像拉希德本人。

使用这个语音翻译系统,用户需要进行约一个小时的训练,为自己的语音建模,并与微软的标准文字-语音模式融为一体,用于对目标语言的翻译。以微软的标准西班牙语模式为例,标准西班牙语模式有一个“S”的发音,用户训练后,就可以用自己发的“S”音来替代。按照这样的步骤,对微软西班牙语文字-语音模式中的所有单个音素进行处理。目前,这种方法可以实现微软语音平台支持的所有26种语言间的互译,这些语言涵盖了全球多数重要的语言。更多项目介绍和示例,请看http://research.microsoft.com/en-us/projects/mixedlangtts/default.aspx

高保真面部动画捕捉

“高保真面部动画捕捉”展示了一种高保真3D面部表现的新方法,用来获取逼真的动态皱纹和精细的面部细节。该方法充分利用最先进的动作捕捉技术和3D扫描技术,以获取面部表现。该捕获面部表现的系统兼具静态面部扫描系统的空间分辨率,以及动态捕捉系统的采集速度。

现有的脸部和表情捕捉手段包括基于标记的动作捕获和高分辨率扫描仪。在基于标记的技术中,需要将小反光点固定在被摄者的脸上,当他的表情变化时,这些反光点之间的相对位置变化就会被记录在视频上。这种方法能够准确地捕捉不断变化的表情,但空间分辨率较低,无法捕捉表情变化的细节。另一方面,高分辨率扫描仪能够捕捉到人脸的所有细微之处,甚至包括细小的皱纹和皮肤毛孔,但通常只能适用于静态姿势。经过专门配置的高速摄影机也可用于捕捉面部表情,但它们价格昂贵,而且只能提供较少的面部细节。

基于这两种捕捉技术的特点,研究团队试图将基于标记系统的动作捕捉精准度与高分辨率扫描仪的丰富细节结合起来。研究人员还希望从计算的角度,提升捕捉和识别的效率,这样就把重建精确面部表情所需的数据量减到最小。

下一步,研究小组利用激光扫描仪捕捉高保真的面部扫描。然后,将这些扫描与基于标记的面部数据中的对应画幅相匹配。他们使用新的算法,实现了面部扫描的互相配准。最后,研究小组综合运用动作捕捉信息和面部扫描信息,重建演员当时所做的实际表情,其所产生的图像既捕捉到了脸上的“大”运动,又捕捉到了皮肤纹理和皮肤运动的精致细节。

Windows Phone 7和Kinect上的语言学习游戏

“Windows Phone 7和Kinect上的语言学习游戏”是一个语言学习项目,侧重于如何在各个微软平台上促进愉快的“寓教于乐”体验:

  • SpatialEase:用一个Xbox 360 Kinect游戏学习语言,这是一种将语言与思想和行动相联系的学习方式。学习者必须迅速理解第二种语言的命令,例如对“把左手向右移动”这句话的翻译,同时相应地移动自己的身体。
  • Tip Tap Tones:这是一个用Windows手机游戏学习中文发音的游戏——一种高效的对耳朵和大脑进行再培训的手机游戏,能够快速而准确地感知带有声调的中文音节。
  • Polyword Flashcards:这是具备综合性技能游戏的“网络抽认卡”。在我们的自适应学习算法——已转移到了必应词典,在其基础上,我们创建了一个HTML5平台,用于深度个性化的学习,并将语言学习、游戏和探索融为一体。

请看详细项目介绍http://research.microsoft.com/en-us/projects/languagelearninggames/

更多2012微软技术节的精彩内容,请关注http://research.microsoft.com/en-us/um/redmond/events/techfest2012/default.aspx

相关阅读:

记里克•雷斯特2012微软技术节开幕演讲

自然人机交互与大数据——2012微软技术节构想未来计算愿景

锐意探索,创造未来——热烈庆祝微软研究院成立20周年

微软研究院将梦想变为现实的20年

___________________________________________________________________________________

欢迎关注

微软亚洲研究院人人网主页:http://page.renren.com/600674137

微软亚洲研究院微博:http://t.sina.com.cn/msra

微软亚洲研究院的大数据与大智慧相关推荐

  1. 2015年微软亚洲研究院的惊艳项目,人工智能抢眼

    2015年微软亚洲研究院的惊艳项目,人工智能抢眼 发表于2015-12-01 14:20| 949次阅读| 来源CSDN| 6 条评论| 作者钱曙光 机器学习微软亚洲研究院人工智能大数据数据库云计算深 ...

  2. 大数据24小时:原微软亚洲研究院梅涛博士加盟京东,波兰计划把数字货币纳入反洗钱监管

    [数据猿导读] 原Facebook 人工智能实验室主任杨立昆卸任,改任首席AI科学家:又一国家政策即将出台,波兰计划把数字货币纳入反洗钱监管:计算机视觉专家梅涛博士加入京东,任AI平台与研究部AI研究 ...

  3. 北京内推 | 微软亚洲研究院数据知识智能组招聘大模型研究实习生

    合适的工作难找?最新的招聘信息也不知道? AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职! 微软亚洲研究院 与MSRA Data Knowledge Intellig ...

  4. [内推] 微软亚洲研究院(上海)热招研究员和开发工程师:人工智能、云和边缘计算、大数据与知识挖掘等...

    有兴趣的童鞋,请砸简历到 junhan(AT)microsoft(DOT)com , 如果合适,我会帮大家内推~ 也欢迎找我来咨询详情~ 更多其他职位请访问:[内推] 微软 7 月最新热招职位(已经有 ...

  5. 微软亚洲研究院成立OpenNetLab,探索以“数据为中心”AI网络研究新范式!

    2020年12月18日,微软亚洲研究院宣布联合清华大学.北京大学.南京大学.兰州大学.新加坡国立大学.首尔国立大学等多所亚洲地区高校,成立OpenNetLab开放网络平台联盟. OpenNetLab官 ...

  6. 微软亚洲研究院刘铁岩博士:迎接深度学习的“大”挑战(一)

    微软亚洲研究院刘铁岩博士:迎接深度学习的"大"挑战(一) 所属栏目: 科技资讯    发布时间: 2017-03-11 14:42:10   文章来源:雷锋网   阅读:2674 ...

  7. 北京内推 | 微软亚洲研究院DKI组招聘大模型方向研究实习生

    合适的工作难找?最新的招聘信息也不知道? AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职! 微软亚洲研究院 Cloud Intelligence组是微软亚洲研究院DK ...

  8. 中国AI半壁江山:微软亚洲研究院20年20大创业公司

    转自:量子位 (公众号 ID: QbitAI)授权转载,转载请联系出处. △ 当年.图片来自@MSFTResearch 微软亚洲研究院(MSRA)20周岁了. 这20年里,发表论文5000多篇,和30 ...

  9. 关于 AIOps 的过去与未来,微软亚洲研究院给我们讲了这些故事

    作者 | 贾凯强 出品 | AI科技大本营(ID:rgznai100) 在过去的15年里,云计算实现了飞速发展,而这种发展也为诸多的前沿技术奠定了基础,AIOps便在此环境中获得了良好的发展契机.在数 ...

最新文章

  1. 图神经网络新课上架:​宾大2020秋季在线课程开课,视频上线B站
  2. python制作射击游戏_用python3从零开始开发一款烧脑射击游戏#2
  3. IOS中将对象属性列表归档成一个plist文件中
  4. 城市间紧急救援 (25 分)【dijkstra模板 超时原因】
  5. centso7.5 安装postman(实测)
  6. 【自考总结】寒冬里的温暖
  7. Java 编程(基础面试题)
  8. Confluence OGNL表达式注入漏洞复现与分析(CVE-2022-26134)
  9. stm32采集交流电压信号_基于STM32的多路电压采集的设计与实现
  10. 魅族 刷机android 6.0,魅族MX6如何刷机升级 魅族MX6升级方法【详解】
  11. Unity3D游戏开发之MMD For Unity插件研究
  12. 数字化营销如何打造全链路数据统计解决方案
  13. pandas5 数据分组与聚合
  14. Unreal Engine 4 控制台命令参数合集
  15. antd日期选择组件a-range-picker默认选中的时分秒
  16. springboot+dubbo+tomcat部署出错问题
  17. 机器学习分类模型评价指标之ROC 曲线、 ROC 的 AUC 、 ROI 和 KS
  18. socket是什么意思
  19. 【转载】网站关闭了域名备案信息是否需要注销,答案是一定要记得注销域名备案信息
  20. 自动领取起点网页版的经验值

热门文章

  1. excel文件的打开密码忘记了怎么办?
  2. Result Maps collection already contains value for 问题总结
  3. access h3c交换机光口_华为交换机如何配置?access、trunk、hybird端口详解
  4. [CF538B]Quasi Binary
  5. 机器学习-随机森林-分类
  6. 文件服务器被误删,文件服务器文件误删
  7. 引流软件之唱吧引流脚本演示引流教学
  8. 怎样做一个优秀的(懒惰的)系统管理员
  9. 计算机技术转让增值税,技术转让时增值税怎么处理?
  10. 请放弃使用付费软件,免费好用抢票软件,开心回家