《残疾人手语交流辅助系统手语识别与翻译》

【本来以为这是一篇学位论文,没想到是比赛的“感言”,不过比赛有一个地方很好,什么最好用、最简单用什么,而是一大堆为写论文而进行研究的东西,各种先进算法交杂在一起】

1、 特征提取

原始数据含有背景等大量无用成分,通过骨架技术,直接获得手的运动信息,减小问题复杂度。硬件和软件使用的是:Kinect和OpenNI。Kinect可以获得深度图像,OpenNI不太了解,查了下,【百度百科】例如,一个中间件可以接收一副有人的图像,计算并返回人手掌在图像中的位置。OpenNI提供了一组基于传感器设备的API,以及一组由中间件组件实现的API。通过打破传感器和中间件之间的依赖,使用OpenNI的API编写应用程序就不需要额外的努力去处理由不同的中间件共存带来的问题(跨平台)。在本论文的后边描述,可以知道调用了《骨骼提取》算法,这是个不开源的【知乎】OpenNi类似Kinect的SDK,但是里面的很多算法不是开源的,比如实时的human poseestimation, hand tracking。这些算法来自一个叫primesense的公司的middleware,估计也是微软持资,openni只有接口。后期,骨骼提取技术因为处理速度慢,是整个系统的瓶颈,因为不开源的原因无法处理,因此添加了FPGA,【百度百科】系统设计师可以根据需要通过可编辑的连接把FPGA内部的逻辑块连接起来,就好像一个电路试验板被放在了一个芯片里。一个出厂后的成品FPGA的逻辑块和连接可以按照设计者而改变,所以FPGA可以完成所需要的逻辑功能。简而言之,就是一个有专门用途的芯片。

选择左右手、肘关节、肩关节6个骨架节点,在获得骨架节点后,通过常态化处理,使得每个动作延续121帧,原因是,标准化便于后期处理,方式是,均匀分配和插值处理。

2、 数据处理

从骨架6个节点计算出14个特征点,每个动作总共121帧,总计1694个特征。通过SVM(支持向量机)对获取的向量处理。

通过LIBSVM训练分类器,而不用自己从头开始做。

【参与竞赛与做产品一样,总会使用最成熟、最简单的技术,不一定最先进,但最起码是次优的。这篇论文中,6、14、121这些数字的来源很令人好奇,估计也是从某个地方看过来的吧,另外,图像识别的关键环节:图像获取与预处理、SVM训练都利用成熟的技术和产品】

《基于数据手套的虚拟手的实现》

1、流程图,通过流程图可以对整个系统或者整篇论文有个基本的认识,之后可以对号入座,提高学习效率。

OSG不了解,【百度】OpenSceneGraph(简称OSG)使用OpenGL技术开发,是一套基于C++平台的应用程序接口(API),它让程序员能够更加快速、便捷地创建高性能、跨平台的交互式图形程序。它作为中间件(middleware)为应用软件提供了各种高级渲染特性,IO,以及空间结构组织函数;而更低层次的OpenGL 硬件抽象层(HAL)实现了底层硬件显示的驱动。OpenGL不懂,【百度】OpenGL(全写Open Graphics Library)是指定义了一个跨编程语言、跨平台的编程接口规格的专业的图形程序接口。它用于三维图像(二维的亦可),是一个功能强大,调用方便的底层图形库。【百度链接】OpenGL学习总结

一.OpenGL是做什么的

一种图形硬件的接口。而不是像C和C++一样的编程语言,更像是一个运行库,提供一些预先封装的函数。

二.OpenGL的主要功能是什么

建模,变换,颜色模式设置,光照和材质设置,纹理映射,位图显示和图像。

三.OpenGL的体系结构是什么

最底层为图形硬件,第二层为操作系统,第三层为窗口系统,第四层为OpenGL,第五层为应用软件。

四.怎么样利用OpenGL来实现我们想要做的事情

首先要明白一点,OpenGL是一个与平台无关的三维图形接口,操作系统必须提供像素格式管理和渲染环境管理。因此要使用OpenGL来做我们想做的事情的时候,一定要先为OpenGL搭建一个窗口环境。在这个窗口环境中,我们才能够使用OpenGL来实现我们自己的目的。

另外要注意的是OpenGL应用的不是保留模式,而是直接模式。即我们去操作的并非是已经封装好的一些建好的图形信息,而仅是相当于操作一个图形界面。也就是说如果我们要画一个复杂的形体,我们要把这个形体的几何信息,包括点、线和面的一些信息包括进去,然后使用一定的方法,把这些基本的信息合起来,构成我们要创建的那个物体。中间件不懂,【知乎】其实从广义来说 操作系统上,业务系统下与业务无关的 ,都是中间件,包括数据库,离线等。当然 实际上不会这么分。 不过利用这个讲法应该能够更容易的去理解中间件是什么。对比与这个说明,库函数是位于代码与程序之间的中间件。

2、使用3D MAX和Creator建立手的3D模型,不研究这个,所以不细看,但作者的一个观点很令人耳目一新,通过树状结构建立数据库结构,原因有二:1、按照几何特征进行有效组织,并将模型转化为方便进行编辑和移动的节点;2、这种树状结构非常适合实时系统进行各种便利操作。【这样的思路跟之前读的结构模式识别很相似,利用模式(模型)本身的结构约束构建系统,减小不确定性】

3、数据手套的数据获取与处理

使用DG5 Vhand2.0数据手套,由5个嵌入玩去传感器测量手指的平均屈伸度,通过三轴加速计获得手的运动和方向。在软件层面,调用配套的函数库即可获得手的运动数据。

4、数据手套与虚拟手的交互控制

不是特别感兴趣,实现手套获取数据与虚拟手控制数据的某种映射。OSG可能采用MVC模式,Controller为数据手套,View为OSG提供的界面,Model为OSG映射函数。

【图像识别】【论文】残疾人手语交流辅助系统手语识别与翻译基于数据手套的虚拟手的实现相关推荐

  1. 残疾人手语交流辅助系统手语识别与翻译基于数据手套的虚拟手的实现

    残疾人手语交流辅助系统手语识别与翻译&&基于数据手套的虚拟手的实现 1. 特征提取 原始数据含有背景等大量无用成分,通过骨架技术,直接获得手的运动信息,减小问题复杂度.硬件和软件使用的 ...

  2. java教学辅助系统的源码_基于jsp的教学辅助系统-JavaEE实现教学辅助系统 - java项目源码...

    基于jsp+servlet+pojo+mysql实现一个javaee/javaweb的教学辅助系统, 该项目可用各类java课程设计大作业中, 教学辅助系统的系统架构分为前后台两部分, 最终实现在线上 ...

  3. 计算机考试系统的相关外文翻译,基于SSH的计算机在线测评考试系统设计与实现毕业论文+任务书+开题报告+外文翻译及原文+开题PPT+中期PPT+毕业答辩PPT+项目源码及数据库文件...

    目  录 摘  要 本系统基于B/S结构的模式开发,通过网络给广大用户提供了比较可靠.方便.快捷的在线测评平台,系统主要实现了自动抽取试题.人工出题.套题选择.自动阅卷计分.在线测试.用户信息管理.成 ...

  4. 先进驾驶辅助系统ADAS一些技术应用小结

    手上有些有关ADAS的文档,有的时候翻过一遍,ms都知道,但印象不深,所以,自己总结下相关技术应用特性,常见缩写及全称,便于经常回顾. ADAS全称Advanced Driver Assistance ...

  5. 停车辅助系统的技术和变化

    各种各样的停车辅助系统已经存在了很长时间,但用户经常在不知道什么技术以及它是如何工作的情况下使用它们. 今天我们依次来谈谈停车辅助系统是什么,怎么发展以及如何应用的. ​ 1.手信号 您可能会想,&q ...

  6. ADAS高级驾驶辅助系统浅解答

    手上有些有关ADAS的文档,有的时候翻过一遍,ms都知道,但印象不深,所以,自己总结下相关技术应用特性,常见缩写及全称,便于经常回顾. ADAS全称Advanced Driver Assistance ...

  7. ADAS高级驾驶辅助系统

    手上有些有关ADAS的文档,有的时候翻过一遍,ms都知道,但印象不深,所以,自己总结下相关技术应用特性,常见缩写及全称,便于经常回顾. ADAS全称Advanced Driver Assistance ...

  8. 读手语图像识别论文笔记

    文章目录 1.手语识别背景 2.国内外现状 3.关键词 3.1特征值 3.2分类决策 1.手语识别背景 ​ 根据世卫组织最近的一项报道表明,在全球有超过10亿的残疾人,就聋哑人占残疾人口的10%.截止 ...

  9. 听障人士亲述:我们在VRChat用手语交流,成员规模5000人

    如果你在B站上搜索VRChat,排在前面的热门视频几乎都是与老外聊天的内容.除了练习语言.交文化流外,你还能在VRChat上遇到不少哇哇乱叫的小孩.作为一款VR社交应用,除了有趣的小游戏外,说话聊天也 ...

最新文章

  1. sql server 的一些记录
  2. Android Pie提供了自适应供电、神经网络API 1.1等新特性
  3. 谷歌最新的PlaNet对强化学习以及迁移学习的意义及启发
  4. 中天亮剑——打击网络风暴侵袭
  5. 毕业设计——学术交流管理系统的设计与实现-1
  6. 计算机技术qq交流群,专业计算机群QQ
  7. Spring数据分析思维课
  8. @property (nonatomic,retain)中的nonatom和retain是什么意思
  9. javascript成神之路(1):如何编写高质量的js代码
  10. 导出android app安装包,Android app导出apk方法
  11. 假冒网站引发多重安全风险 | 官方严正声明:切勿在非官方渠道购买或下载 Navicat 软件
  12. 【毕业设计】机器学习二维码识别检测系统 - python opencv 机器视觉
  13. java如何枚举定义一个数组_Java中如何将字符枚举类变成一个数组
  14. Java写时复制CopyOnWriteArrayList
  15. Android Studio 实现单选对话框
  16. MySQL5.5版本安装详细讲解
  17. 计算机控制系统信号分析
  18. Windows 下 IDEA 的 JRE 配置
  19. 【数据库设计】学生学籍信息和学期学年课程成绩信息表以及插入数据的python脚本生成设计
  20. Swift:我的第三个Demo

热门文章

  1. 最有效的大脑休息方法
  2. 2020必读的12本机器学习书籍
  3. Apple ID双重认证验证码无法输入问题
  4. 从零开始之应用发开、linux应用(一、应用调试之strace)
  5. 联想微型计算机c5030拆机,联想C5030一体电脑配置单
  6. 李飞飞计算机视觉总结
  7. 数据增强(扩充图像,以增加数据集)
  8. 【Selenium】解决 无法模拟定位点击
  9. Oracle之trim( )、ltrim( )、rtrim( )三个函数的用法及陷阱
  10. 吐槽memoQ | 设置字体大小