本文转载自程序员极客实验室

相信不少人和小编一样,一旦滑到可爱的狗子视频,都会忍不住多看几秒,然后狠狠地点个赞。

都说“吸狗一时爽,一直吸狗一直爽”,不过尽管“云吸狗”十分流行,在这里要说,“云吸狗”还是没有真·吸狗来得香。

和小编所见略同的,还有这个加拿大小哥Ryder。

不同的是,Ryder真的亲手做了一个狗子探测器,这个探测器还和扩音喇叭联结在了一起,但凡有人遛狗经过了他们家,探测器首先会进行识别,然后这个喇叭就会提醒他,“快来吸狗啦!”

这还不止,Ryder还突发奇想,这些狗子都这么可爱,它们的主人也应该得到赞赏。

于是,他对整个系统进行了改进。现在这个扩音喇叭不仅能提醒他赶紧吸狗,还能对着路边的狗主人大声说到,“我喜欢你家的狗子(I like your dog)”。

当然,不明所以的路人可能会一脸懵逼:

甚至还有热心的读者留言到,“其实你还可以装一个零食发射器,给路过的狗子派发零食”。

那小编就在这里坐等这个装配了零食发射器的狗子探测器了。

超简单的狗子探测器,只需树莓派,项目已开源

根据Ryder自己介绍,这个项目是为了自己的一个朋友,他曾经做出翻越6英尺围栏就为了撸一只狗的创举。

所以,其实整个项目的思路也很简单,只需要去识别经过的狗子,然后通知他就行了。

那么就动手吧。

首先,准备一个树莓派相机,对准窗外的大街,实时记录动态,然后将这些数据喂给一个机器学习模型,模型便会根据输入数据识别对象。

Ryder使用的这个模型叫做YOLOv3,这个模型中的数据都是人工进行标记的,当数据达到一定的量级后,他们便把这些数据喂给机器学习系统,随后进行训练。

据了解,这个模型能识别80多种物体,包括狗子、人和汽车等。

Ryder用自定义码将这些系统组合在一起,然后就可以上街进行测试了。

可以看到,系统不仅正确识别出了人和狗子,路边的汽车也被标记了出来。

接下来,Ryder拿出了一个扩音喇叭,录入了语音消息,这下子有狗子经过,就能得到实时通报了。

不过也不是每次都能保证有很好的视野就是了。

目前,Ryder也把这个“狗子识别”项目开源在了GitHub上,有需求的朋友自取~

GitHub链接:

https://github.com/rydercalmdown/dog_detector

YOLO背后的那些事儿

说到目标检测网络YOLO,这应该是目前最为常用的目标检测算法了,在自动驾驶、人脸识别等领域都有一展身手之地。

YOLO最早是由Joseph Redmon等人在2015年提出,并在随后的几篇论文中进行了修订。单是凭借YOLO,Redmon就先后获得2016年CVPR群众选择奖、2017年CVPR最佳论文荣誉奖。在学术界,YOLO也是广受欢迎,三篇一作论文总引用量已经超过16000次

在性能上,由于YOLO只使用单个网络,其便可以直接在检测性能上进行端到端优化,使得基础YOLO模型能以每秒45帧的速度实时处理图像。

就以YOLOv3为例,在Pascal Titan X上处理608x608图像速度达到20FPS,在COCO test-dev上 mAP@0.5达到57.9%,与RetinaNet的结果相近,并且速度快4倍

同时,YOLOv3在发扬了YOLO系列速度优点的同时,还提升了模型精度,尤其加强了对小目标和重叠遮挡目标的识别,补齐了此前的短板,是当时速度和精度均衡的目标检测网络。

不过,就在去年初,YOLO之父Joseph Redmon却突然宣布,退出计算机视觉领域。

Redmon在推特上表示,由于军用和隐私方面的问题和担忧,自己选择不再进行CV方面的研究

Fast.ai创始人Jeremy Howard转推评论到,“我之前从来没见过这种事”

更让大家关心的是,YOLO的更新也暂时被搁浅。

不过好在两个月后,另一位曾经参与YOLO项目维护的Alexey Bochkovskiy,在arXiv上提交了YOLOv4,这篇论文也被拉入原来YOLO之父建立的项目主线。

根据论文介绍,在COCO数据集上,YOLOv4达到了43.5%AP,65FPS,分别提高了10%和12%,运行速度是EfficientNet的2倍

YOLOv4的速度(FPS)、精度(MS COCO AP50…95和AP50)均超过了其他目标检测器。

论文总结道,YOLOv4主要有以下3点贡献:

  • 提出了一种高效而强大的目标检测模型,使用1080Ti或2080Ti就能训练出超快、准确的目标检测器;

  • 在检测器训练过程中,验证了最先进的Bag-of-Freebies和Bag-of-Specials方法对目标检测器的影响;

  • 改进了SOTA方法,使其更有效、更适合单GPU训练。

据介绍,YOLOv4也用到相当多的技巧:

  • 用于backbone的BoF:CutMix和Mosaic数据增强,DropBlock正则化,Class label smoothing

  • 用于backbone的BoS:Mish激活函数,CSP,MiWRC

  • 用于检测器的BoF:CIoU-loss,CmBN,DropBlock正则化,Mosaic数据增强,Self-Adversarial 训练,消除网格敏感性,对单个ground-truth使用多个anchor,Cosine annealing scheduler,最佳超参数,Random training shapes

  • 用于检测器的Bos:Mish激活函数,SPP,SAM,PAN,DIoU-NMS

不过,还是要说,技术是中立的,区别在于使用技术的人

比如这个狗子探测器,既能够发挥YOLO的价值,也能治愈人心,何乐而不为呢?

加拿大小哥用树莓派做了个狗子探测器相关推荐

  1. 全程快捷键!硬核小哥超快配图1700页数学笔记,教你上手LaTeX+Inkscape

    边策 乾明 发自 凹非寺  量子位 报道 | 公众号 QbitAI 之前,我们介绍了一位神奇的本科生,他在数学课上用Vim+LaTeX,全程手打出1700页课堂笔记,速度直追老师的板书. 现在,这位G ...

  2. 非科班AI小哥火了:他没有ML学位,却拿到DeepMind的offer

    点击上方"视学算法",选择加"星标"或"置顶" 重磅干货,第一时间送达 衡宇 发自 凹非寺 量子位 | 公众号 QbitAI 这两天,Dee ...

  3. URL 地址栏能玩出什么新花样?这位歪果程序员小哥给你开开脑洞!

    前言 在现在一些互联网营销号的传播素材中,程序员往往会被塑造成一个邋遢.木讷.秃头.低情商的形象,以借此博得普通群众的眼球,吸引他人注意力. 前阵子,暴走漫画发布的一个视频<创造1024> ...

  4. 程序员口中的demo是什么意思_URL 地址栏能玩出什么新花样?这位歪果程序员小哥给你开开脑洞!...

    前言 在现在一些互联网营销号的传播素材中,程序员往往会被塑造成一个邋遢.木讷.秃头.低情商的形象,以借此博得普通群众的眼球,吸引他人注意力. 前阵子,暴走漫画发布的一个视频<创造1024> ...

  5. 为给微芯片拍照,IBM小哥用乐高拼了个电动显微镜,搭载树莓派,360度无死角拍摄...

    来源:IEEE Spectrum 本文约1739字,建议阅读5分钟. 本文介绍一位乐高爱好者Yuksel Temiz为了从各种角度拍摄微流控芯片,用乐高.Arduino和树莓派,一起DIY了一个高精度 ...

  6. 前端小哥玩HTML复选框上瘾,能画logo做视频,还开源成JS库

    行早 发自 凹非寺 量子位 报道 | 公众号 QbitAI 万万没想到,如此普通的复选框,竟也能玩出这种高度! 例如点一下复选框,屏幕就像被投入石子的水面泛出波纹: 设定好初始状态,就可以开始展示&l ...

  7. 【高数+AI】中山大学的学霸小哥开源了一个能帮你做高数题的AI

    来自:开源最前线(ID:OpenSourceTop) 链接:https://github.com/Roujack/mathAI 中山大学的一名叫mathAI的硕士学霸小哥在GitHub上开源了一个拍照 ...

  8. python爬虫怎么赚钱-小哥用Python兼职月入过万,用Python做项目有多赚钱

    原标题:小哥用Python兼职月入过万,用Python做项目有多赚钱 问:请问用Python可以接哪些兼职的活赚钱? 1.兼职费用足够学费+生活费 恰巧上学期间接过一些外包,恩,足够我和我媳妇的学费以 ...

  9. 大学数计算机学霸曾做出的数学题,中山大学的学霸小哥开源了一个能帮你做高数题的AI...

    来自:开源最前线(ID:OpenSourceTop) 链接:https://github.com/Roujack/mathAI 中山大学的一名叫mathAI的硕士学霸小哥在GitHub上开源了一个拍照 ...

最新文章

  1. 微信支付-接收返回通知结果
  2. php mysql可以跨站_PHP防跨站之open_basedir目录设置
  3. Java 求1000以内的同构数_求1-10000之间的同构数
  4. kafka修改分区数_大数据技术:解析SparkStreaming和Kafka集成的两种方式
  5. JAVA8的新特性之Stream
  6. 数据结构专题(二):2.7顺序表反转
  7. DBATools PowerShell SQL Server数据库备份命令
  8. HTML5:web socket 和 web worker
  9. 电大本科免考英语和计算机,网络教育本科英语和计算机统考免考条件是什么?...
  10. 2013北理机试-中缀转前缀
  11. 人大金仓数据库使用uuid
  12. 声音均衡器怎么调好听_完美音效就靠它了!最详细均衡器调整方法
  13. 手机里面android什么意思,wipe什么意思?安卓手机如何wipe
  14. linux开启磁盘多队列(blk-mq)
  15. 同一目录下批处理执行Word宏
  16. 分布式锁的一些细节问题,值得收藏
  17. ArGIS Engine专题(6)之利用GP水文分析工具实现基于DEM的山脊线提取
  18. APS高级计划排程系统,工厂各部门实施前后有哪些区别?
  19. python图片保存jpg、show变成bmp_Python 图片格式转换
  20. [转]小程序登录与授权区别

热门文章

  1. java编写的获取抖音评论uid,小软件
  2. Aardio做的一个小说在线阅读器
  3. sql含变量的模糊查询
  4. Python-基础练习
  5. 一年花在塑料袋上的钱,可买两只香奈儿口红!换种省钱环保的方式来时尚丨钛空舱...
  6. 【童年回忆】4399造梦西游3,卡无限4级强化石,卡无限任务,CE修改教程
  7. CAJ文件转换成PDF文件
  8. 计算机网络(五层协议)
  9. Word2007视频教程
  10. 上阳MSN手机客户端测试版(README)