自己从事算法工作多年,每个算法技术想要真正落地是很难的,或是经历漫长艰辛的过程才得以成功。随着时间自己更多的去思考在这个行业自己的方向、价值在哪里。在算法这个领域,我不属于学者研究型,我想这个领域大多数的同学更多的是工程落地+算法改进。至少在我的周围表现出的现象是绝大多数更甚者所有的算法模型都是借鉴开源网站项目。对我自身而言其实这没有什么不好,使项目实现更高效,风险更低,时间成本更少。但是反过来想想,自身不可替代性又在哪。单个具体算法有点功底的人都可以使用,大家训练的模型可能差距就是微小的几个百分点或是一个百分点内,可能sota(某领域目前最优秀算法)、benchmark、baseline的模型对于实际业务产生的效益没有太大区别,当然实际情况我们还是愿意使用sota模型。我只是从实际需求产出的角度考虑,自身工程落地+算法改进的角色思考,但是不能否定算法研究本身是有价值的。我也是自己在提醒自己,自己不能对于单个算法陷入很深,就算现在是sota,之后也不可能一直是sota,sota对于落地的帮助有多大,如果太注重sota视乎有点本末倒置(当然有的需求场景相差1个百分点的收益差都是巨大的,但是是个例,实际情况实际分析,这里只说大多数情况),而是要好好考虑真实需求,算法是为需求服务的,为了实现这个需求需要什么算法,怎么去组建这个算法应用系统,每个算法达到什么样的性能指标才能满足此需求,另外这个需求的满足是否算法是全部,是不是还要加入其它功能模块才能完整实现,比如适当的交互逻辑,前端界面等部分。

前面是我心理之前的问题和思考,我现在想做一个不同类型任务的算法组件化的最小应用框架,我说的不同类型任务,比如视觉方面:1)分类识别,2)目标检测,3)关键点回归,4)姿态估计,5)实例/语义分割,6)度量学习,7)ocr识别等等不同任务,甚至NLP不同任务。而很受欢迎的开源项目mmdetection,在我的觉得它就是一个多元化的目标检测算法组件,都是属于目标检测类型。这里我这样去定义也是从项目的实现角度去考虑,项目一般不是由多个检测模型就能实现,它会用不同类型任务模型去组合实现。大家可以思考自己见过的项目产品是否是这样,这也是目前我的单个开源项目是很独立的不同的任务类型。

客观的讲,单个开源项目本身对于大家的吸引力其实没有啥(当然每个项目规整好的开源数据集和预训练模型还是有少许吸引力的),大家也能从其它开源网站获取同类型任务的算法项目,甚至是更好的sota算法项目。但是我用这些不同任务类型的算法组件构建的手势交互识别书中的狗狗种类的应用demo,对于大家是有吸引力的,他可能具有潜在需求。从技术实现的角度分析它也是一个多任务算法组件实现的,且加入了算法模型外的交互逻辑等部分。

该系统(虽然demo很demo但是暂且方便叫它为一个系统)具体包括:
       1)深度学习算法模型部分
            A、目标检测(手的检测)   ,B、关键点回归(手的21个关键点),C、分类识别(狗狗分类识别)

2)物体跟踪部分

A、物体跟踪传统算法(服务于触发识别物体的交互逻辑)
      3)识别触发逻辑部分
           A、两只手位置稳定,即代表用户想知道某个特定信息,而特定信息的位置,是通过两只手的食指构成的边界框区域确定。当然后面还可以继续改进比如加上两只手同时为one的静态手势,这样会减少出现识别误触发信号。(后面我又发了一个单手指+静态手势的区域选择交互demo,我想抛我这个砖引同学们的玉,集思广益,更好的交互方式,更好的算法实现架构,更好的实际需求挖掘,更好的落地)。

之后我会继续发布不同开源项目,同时我也在构建不同类型任务的算法组件化的最小应用框架也会发布alpha版本,目前考虑第一个案例就拿手势交互这个场景去做最小应用框架的demo,当然我的很多想法可能不成熟,但是我觉得还是继续推进,在实际应用中去检验试错,它是我目前看到的方向。我的期望是让AI技术“普惠”,让其服务于更多的人和需求,让项目、产品落地实现者更加高效,项目试错成本更低,更快的产生收益。

就讲那么多,项目开源地址:https://codechina.csdn.net/EricLee/handpose_x

哔哩哔哩视频地址:https://www.bilibili.com/video/BV1nb4y1R7Zh/

https://www.bilibili.com/video/BV1Bb4y1R7sd/

不早了,在这里我还是不忘记上项目的demo视频。

开源项目 - 手势识别 ,静态手势 ,单手UI交互, 物体(ocr)识别 ,增强现实 AR手势识别

开源项目 - 手势识别 hand pose 手势 UI 交互识别 增强现实 AR手势识别

2021-“新“的开源项目之handpose_x(手势识别交互)相关推荐

  1. CVPR 2021 论文和开源项目合集(Papers with Code)

    摘自:https://github.com/amusi/CVPR2021-Papers-with-Code CVPR 2021 论文和开源项目合集 CVPR 2021 论文和开源项目合集(Papers ...

  2. 人生重开模拟/合成大西瓜/小空调......2021爆款开源项目盘点

    转眼间,2021年已过大半,你还记得今年在开发者朋友圈里爆红的开源项目吗? 本文就来简要盘点2021涌现出的"宝藏"级开源项目,看看这一届的开发者们,又有哪些新脑洞! 彩蛋:大部分 ...

  3. go新手看的开源项目 哪些适合_最近大家都在用 Go 语言玩什么?这几个新的开源项目告诉你...

    自 2009 年 11 月正式宣布推出以来,Go 语言凭借着其简单.高效.资源占用低的优势逐渐在开发者人群中变得热门起来,优秀的 Go 语言开源项目层出不穷.Gitee 上优秀的开发者们也已经分享了近 ...

  4. 云原生周报 | 2021下半年CNCF开源项目发展总结;Cilium 1.11发布;BFE Server及控制面更新

    业界要闻 1. 2021年年底 CNCF 开源项目和发展速度概况 摘要:本文总结了2021年下半年 CNCF 开源项目的发展速度,其中 OpenTelemetry 在 CNCF 中拥有第二大贡献社区( ...

  5. 支持Dubbo生态发展,阿里巴巴启动新的开源项目 Nacos

    摘要: 上周六的Aliware技术行上海站Dubbo开发者沙龙上,阿里巴巴高级技术专家郭平(坤宇)宣布了阿里巴巴的一个新开源计划,阿里巴巴计划在7月份开启一个名叫Nacos的新开源项目, 在活动演讲中 ...

  6. (转)支持Dubbo生态发展,阿里巴巴启动新的开源项目 Nacos

    贡献Dubbo生态,阿里Nacos开源计划 在上周六的Aliware技术行上海站Dubbo开发者沙龙上,阿里巴巴高级技术专家郭平(坤宇)宣布了阿里巴巴的一个新开源计划,阿里巴巴计划在7月份开启一个名叫 ...

  7. 如何向Openstack社区提交一个新的开源项目

    前几天有个朋友问我,自己有一个idea不错的项目,也把基本的框架写好了,想贡献到Openstack社区,却不知道应该怎么做.正好之前我有过类似的经历,那么来分享一下我是如何向Openstack社区提交 ...

  8. ICCV 2021 放榜!一文看尽10篇论文的开源项目(检测/分割/Transformer等)

    点击下方卡片,关注"CVer"公众号 AI/CV重磅干货,第一时间送达 前言 ICCV 2021 刚刚公布获奖结果!先恭喜各位论文被收录的同学.ICCV 2021 最终收录1617 ...

  9. 专科毕业,从0到1400star,从阮一峰周刊到尤雨溪推荐的开源项目总结

    来自:耗子君QAQ https://juejin.cn/post/7038379264852361246 引言 年度征文来了,想想这一年还是蛮充实的,写写自己这一年的心路历程,扯扯闲篇.作者是四川人, ...

最新文章

  1. cefsharp 发送请求服务器_WEB服务器之HTTP协议
  2. 我十年学习编程的历史
  3. jmap报错unknown CollectedHeap type : class sun.jvm.hotspot.gc_interface.CollectedHeap
  4. ERP系统和ERP软件的介绍
  5. 解决CentOS7 安装后无法识别windows分区问题
  6. NLTK-006:分类文本(性别鉴定)
  7. Apple Compressor 4.4.4 中文特别版 Mac 电影视频后期制作工具
  8. 高仿淘宝首页 - 刚把CSS和JS弄出成了外部,原本写的时候都在HTML一个文件里哈
  9. 渗透测试不同阶段的开源/商业工具
  10. Linux copy命令 omitting directory
  11. aardio部署_aardio学习笔记-变量与常量
  12. 用C#实现一个简易的软件光栅化渲染器
  13. 细思极恐!使用 AI 控制你的浏览器
  14. java无敌_12 款做Java后台管理系统的项目,超级无敌好用!
  15. Angelababy 首攻好莱坞 获封最闪亮新星
  16. 手机浏览器缓存的.ts视频文件如何合成(不下载软件)
  17. 20170215找女朋友之路思考总结
  18. 2 172.02 php,Web服务器部署02: Apache PHP Oracle
  19. 微博上流传的BAT对应级别和工资
  20. Risk Management and Financial Institution Chapter 11 —— Correlations and Copulas

热门文章

  1. 如何复制CD音乐(电脑小技巧)
  2. 粉笔公考——常识专项课——民法典
  3. ADNI数据集-数据分析11.17
  4. 总论点和分论点_您将面对与他人谈论隐私的4个常见论点
  5. Unity3D编辑器插件开发
  6. 夜神模拟器之burp抓包
  7. 有特色的出版社图书封面
  8. Linux lolcat输出彩色格言
  9. 主成分分析(PCA)方法步骤以及代码详解
  10. usb otg type-c的硬件介绍