基于移动终端的汉语手语识别技术研究
摘 要:文中使用图像轮廓填充图形作为手语手势的特征参数进行静态手语识别。关键是提取出图像边缘轮廓,并做出轮廓填充图形,根 据这个特征参数对待测图像进行手语手势的特征匹配。该方法对图像亮度、缩放、平移、旋转具有不变性,而且该方法计算简单、快速,可以 用于基于移动终端(Android手机操作系统平台下)的手语识别系统。 关键词:手语识别 图像轮廓匹配 移动终端

随着计算机技术和通信技术的迅速发 展,多模式人机交互技术研究也有很大进展。手语识别作为多模式人机交互技术的
重要研究方向,其主要目标是使特殊用户 (例如聋哑人)可以用更加方便、自然和符合 其生理特点的方式来使用计算机、手机等 现代化信息设备。总之,手语识别的研究和实现不仅是一门有价值的研究课题,而且 具有更加广泛的社会意义和实际应用前 景。 目前这种方法对图像的亮度、缩放、平 移、旋转具有不变性,具有很高的识别率, 而且识别快速、方便。其缺点在于只能处理 静态的单个的手语图像。但相比以前的电脑平台下的手语识别,这种方法更加的方 便,用很广阔的前景。 据国外媒体报道,美国华盛顿大学的 工程师正在测试一款名为MobileASL的工 具,这款工具能利用运动感知技术去识别 美国手语,并通过手机发送图像。这是目前
唯一可查的研究手语识别技术在移动终端 应用的项目。

1 手语识别建模与实现
通过移动终端(这里主要指手机)获取 一幅待测图片,经过预处理后提取图像轮 廓填充图形作为特征参数,将特征参数与 标准库进行对比,从而识别出改图片对应 的手语含义。原理与模型如图1所示。 通过手机获取26张“ A-Z”标准手语手 势的图片,针对每张图片我们采取以下处
理步骤,以建立标准库:获取图片→灰度处 理→图像裁剪。 本文采用canny算子进行边缘提取。 Canny算子是一个具有滤波、增强、检测的 多阶段的优化算子,在进行处理前,Canny 算子先利用高斯平滑滤波器来平滑图像以 除去噪声,Canny分割算法采用一阶偏导的
有限差分来计算梯度幅值和方向,在处理 过程中,Canny算子还将经过一个非极大值
抑制的过程,最后Canny算子还采用两个阈 值来连接边缘。 对提取的图像边缘进行填充,得到图 像边缘轮廓填充图形。将待测图像的填充 图形在旋转-15°~+15°条件下与标准库 参数进行对比,以得到的相关系数最大的 角度下的图像作为识别结果。这样就能解
决因图像旋转而造成的识别错误的问题。 弥补了边缘方向角直方图参对数旋转敏感 的不足。

2 仿真实验结果与分析
根据上面所述方法,文中采用如图所 示的手语识别系统进行实验。实验以白色极大地减少工作人员的工作量,提高工作 效率,减少工作失误。其工作步骤有以下四 个方面:一是要以班组为基本单位进行划 分,将原始的成本数据一一录入到数据库 中,方便以后的查询;二是确定科学的工程 原料及其他成本统计的方法,这包括人工 费、设备使用费、材料费等数据的统计方 法;三是要制定科学的成本转移措施,就是 将工程需要的原料费等费用计入轧石机、 沥青拌和站等辅助性的生产单位中,提高
成本核算的质量和水平。

3 计算机数据库的管理 3.1 计算机数据库管理的含义与基本内容 计算机数据库管理是指有关建立、存 储、修改、存取数据库中信息的技术,是为 保证数据库系统的正常运行和服务质量, 相关工作人员所进行的技术管理工作。
计算机数据库管理的基本内容包括: 数据库的重组、数据库的调优、数据库的安 全管控、数据库的重构、数据库数据逇日常
备份、报错问题的汇总、报错问题的分析、 报错问题的处理。 3.2 计算机数据库的管理技术 第一,在对计算机数据库进行管理的 过程中可以适时的利用加密技术。对于一 些非常重要的数据信息,比如商业机密、
个人银行信息、游戏玩家的虚拟财产等进 行加密处理,存储数据库内的数据信息的为背景,用数码相机采集手语的手势图片, 采用不同的光照,拍摄了26种不同手势, 将待识别的手语图片建立了一个小型的静
态手语库,图像大小归一化为512×512,其 中一部分作为训练使用。
通过以上的实验我们得出,在手机环 境下手语的识别是可以实现的。在对26个
英文字母的手势的测验中,19张手语手势 可以识别为最相似目标,5张手语手势可
以识别为次相似目标,2张手语手势不可 以识别,识别率为92.31%。与以往的手语 识别方法相比较,这种方法更加的方便, 简单。但与此同时,这种方法也有其自身 的缺点,它只适用于静态的,单个的手语 手势。

3 结语
文中的创新点是结合采用图像边缘轮 廓图形这个特征参数进行静态手语识别。图像边缘轮廓图形的特点是对图像旋转不 敏感。该方法计算简单、快速、识别率高。本文的另一个创新点是基于移动终端的手语 识别。充分利用了3G手机的极高的数据传 输速率的特点,以及支持多媒体通信的优 势,因而该技术具有潜在的巨大的现实意义。
参考文献 [1] 郭彩龙.中国静态手语识别的研究[D]. 硕士论文,西安建筑科技大学,2009. [2] 翟俊海,赵文秀,王熙照.图像特征提取 研究[D].河北大学,2009,1. [3] Von Agris U,Zieren J,Canzler U, etal.Recent developments in visual sign language recognition[J]. Universal Access in the Information Society,2008,6(4):323~ 3 6 2 . [4] 胡友树.手势识别技术综述[J].中国科
技信息,2005(2):42. [5] 张良国,高文,陈熙霖,等.面向中等词 汇量的中国手语视觉识别系统[J].计 算机研究与发展,2006,43(3):476482. [6] Yiqiang Chen,Wen Gao,Changshui Yang,Dalong Jiang,Multi-Model Behavior Synchronizing Prosody Model in Sign Language Synthesis.Chinese Journal of Computers,2006(5). [7] Desmond E.van Wyk,James Connan. High Quality Flexible H-Anim Hands for Sign Language Visualisation[J]. [8] 姜华强,潘红.基于关键帧的多级分类 手语识别研究[J].计算机应用研究, Jan.2010,27(2):491-493.

基于移动终端的汉语手语识别技术研究相关推荐

  1. 【手写汉字识别】基于深度学习的脱机手写汉字识别技术研究

    写在前面 最近一段时间在为本科毕业设计做一些知识储备,方向与手写识别的系统设计相关,在看到一篇2019年题为<基于深度学习的脱机手写汉字识别技术研究>的工学硕士论文后,感觉收获比较大,准备 ...

  2. vivo 首发手语识别技术 + AI手语开放平台

    经过多年的钻研,vivo通过自研的AI识别算法终于实现了手语识别方向上的突破,补上了听障人群沟通4大基础技术的最后一块短板.vivo 副总裁.OS 产品副总裁周围表示:"vivo目前的算法已 ...

  3. 蚂蚁金服张洁:基于深度学习的支付宝人脸识别技术解秘-1

    蚂蚁金服张洁:基于深度学习的支付宝人脸识别技术解秘(1) 2015-08-13 10:22 于雪 51CTO 字号:T | T 用户身份认证是互联网金融发展的基石.今年三月,在德国汉诺威举办的IT展览 ...

  4. android 人脸识别 方法研究,基于Android平台的人脸识别技术研究

    摘要: 在计算机视觉与模式识别领域中,人脸检测与识别技术是一个非常热门的研究课题,同时也具备非常广阔的商业价值.在诸多的目标检测算法中,基于AdaBoost算法的目标检测方法具有检测速度快,检测效果好 ...

  5. 《基于机器学习的雷达辐射源分选与识别技术研究》论文解读

    <基于机器学习的雷达辐射源分选与识别技术研究>论文解读 Data:2023-2-04 Ref: 李雪琼, "基于机器学习的雷达辐射源分选与识别技术研究," PhD Th ...

  6. 现在维吾尔语在计算机中发展,维吾尔语手写体在线计算机识别技术研究.doc

    维吾尔语手写体在线计算机识别技术研究 维吾尔语手写体在线计算机识别技术研究 摘要:维吾尔语是以单词为基本单位的黏连语,字母因在单词中位置的不同而具有不同的书写变形,目前手写技术的发展仍然落后于汉语.英 ...

  7. 孤立词语音识别matlab,基于Matlab仿真的孤立词语音识别技术研究

    基于Matlab仿真的孤立词语音识别技术研究 摘要:研究一种改进的语音识别算法---改进的端点检测(滑动帧)动态时间规整(DTW)算法, 以一个能识别数字0-10的语音识别系统的实现过程为例,阐述了基 ...

  8. 【看论文】之《基于双目视觉的棚室番茄采摘关键技术研究_胡慧明》

    论文信息 题目:<基于双目视觉的棚室番茄采摘关键技术研究> 作者:胡慧明 单位:湖北工业大学 论文性质:硕士学位论文 提交日期:2018.5.31 摘要 绪论 国外研究现状 20世纪60年 ...

  9. 基于软总线的实时组件调度技术研究

    基于软总线的实时组件调度技术研究 摘要:首先分析组件软件工程模式比面向对象的开发模式更优越:接着讨论了组件软件工程的核心机制--软总线,提供组件通讯机制,保证组件的即插即用等功能:然后讨论了软总线中的 ...

最新文章

  1. 卧槽!华为大佬整理的Linux学习笔记和资料不小心流落到了外网.……
  2. 【Silverlight】汉诺塔游戏,带AI
  3. Boost.MultiIndex 使用 Boost.Interprocess 分配器的示例
  4. 启动标志_牛股启动的标志:天衣无缝。
  5. Codeforces 338 D. GCD Table
  6. python绘制散点图的函数_python matplotlib更新函数的散点图
  7. 优化算法笔记|萤火虫算法理解及实现
  8. django-自定义转换器-实操案例
  9. jQuery Post
  10. python和c++哪个好-C/C++和Python哪个更有前景?
  11. CF1190E Tokitsukaze and Explosion 二分、贪心、倍增、ST表
  12. 安川机器人外部信号怎么接线_安川机器人通用输入输出信号定义.pdf
  13. CC2500大功率无线模块
  14. Python基础PTA习题答案
  15. 自动光圈及P-IRIS原理
  16. 华为路由器 wifi网速慢解决办法
  17. 记一次互联网寒冬下的阿里面试总结
  18. 《算法竞赛》获得清华大学出版社最受读者欢迎图书奖、CSDN十大年度IT图书奖
  19. 网络——数字数据编码
  20. linux服务器移动硬盘挂载,linux挂载命令mount及U盘、移动硬盘的挂载

热门文章

  1. ORA-01012: not logged on 解决办法记录错误
  2. 什么是串扰crosstalk
  3. SEO外链收录:锚文本外链代发排名
  4. Html5原生video标签禁止全屏播放的实现
  5. Blbl里面终末的女武神的精彩片段批量采集的方法
  6. MP地面站在飞行数据显示界面显示自己想显示的数据
  7. 【沙发管家】华为悦盒刷机破解详细攻略,附多个第三方精简固件
  8. 单片机定时器计数原理
  9. wps批量将文档括号内的字符串修改颜色
  10. 【洛谷】P1008 [NOIP1998 普及组] 三连击