点击上方“视学算法”,选择加"星标"或“置顶

重磅干货,第一时间送达

作者丨花花,OLDPAN

来源丨知乎问答

编辑丨极市平台

导读

众所周知,Transformer 已经日常在CV学术领域“杀疯了”,那么在工业领域情况如何呢?

来源链接:https://www.zhihu.com/question/463585564/answer/1927466979

# 回答一

作者:花花

阿里巴巴高级技术专家

来源链接:https://www.zhihu.com/question/463585564/answer/1927466979

分类任务:transformer在分类任务上超过cnn让大家欣喜若狂,用pretrain进行finetune是一件合理的事情,但可能大家也有意识到,imagenet-1k, imagenet-21k等pretrain的跨domain问题。
其次,实际项目中,包括模型转化,量化,SDK集成直到模型上线仍然有很大量的工作,链条不完善的情况下,不太容易落地,同时在inference速度上当前没有足够好的优化,也是一个劣势。

检测任务:说完分类再来考虑检测,目前两套思路,一种是换掉backbone,以pretrain的方式进行下游任务,部署难度和分类任务一样;另一种是类似DETR这种训练方式,想要取得较好的精度需要更大量的数据,对于实际项目并不容易获取,且训练相较于普通检测方法多了5到10倍的时间,在没有取得很明显的提升的情况下,也不太适合盲目进行落地。

值得一提的几点:
1. 在public dataset 上杀疯了并不代表在实际业务数据上就能很好的work,这点就不展开了,做过落地的都明白。
2. 当前另外一个方向是自监督+transformer(SSL+Transformer),个人认为非常有潜力,包括微软的swin-ssl,Facebook的dino等,都是这方面的尝试
3. 落地场景不同,情况就不同,人脸上亿量级的数据如果要train from scratch,要直接硬上transformer,计算资源是非常非常可观的。

个人一点不成熟的观点,轻喷:
我认为现在transformer还处于不成熟的阶段,大部分的工作都在分类任务上进行尝试,因为训练成本较高,部分paper的实验结果并不solid,提点也有限,虽然百花齐放但还没有一个较为统一的认知和共识,下游任务(detection,segmentation)的验证也不是很solid。同时底层硬件,CUDA,训练框架对transformer的优化也不够完善。

类比CNN的发展历程,我认为目前transformer在CV领域应该还处于AlexNet阶段,距ResNet阶段还有一定的距离,一方面是research这条线继续推陈出新,另一方面是工程部署这条线的持续跟进(可以看到很多社区的框架也在多分布式训练,transformer训练进行优化和加速)。

  1. 需要另一个里程碑来统一大家的认知

  2. 落地是肯定要落地的,大家一起加油。

# 回答二

作者:OLDPAN

来源链接:

https://www.zhihu.com/question/463585564/answer/1940309173

这个问题问得好呀,说不定楼主都已经踩过坑了 。

在我们组的CV中,识别组大部分的结构都包含transformer,也有一些LSTM和attention,其中有部分模型可以转化为tensorrt然后使用triton部署。相比原生的TensorFlow server要快些。不过仍有提升空间。

而检测组则没有使用transformer,一方面是因为原先的结构比较好部署(ssd,centernet,fcos等结构)比较熟悉,二是cv检测上的transformer结构还不是很成熟,没有比较通用性的backbone可以替换之前使用的resnet这类的通用backbone。

如果之后会使用transformer,我会考虑:

  • 精度提升有多大,对于检测任务来说。如果不是质的提升(十分之一),尽量不考虑

  • 速度能有多快,相比resnet50,同等精度或者高于这个精度能有多快

  • 还是那句话,好不好部署,能否转化为tensorrt,转化后支不支持动态尺寸 这都是问题

其实也简单尝试了一下swin transformer,目前可以转化为tensorrt但只支持固定尺寸,在分类任务上,swin最小结构的精度比res50要高些,但速度嘛,慢了一倍多 ,唉性价比瞬间降低了。

对于我们来说,用不用transformer,关键还是取决于精度和速度能否超过之前的backbone,性价比高不高。不高的话,大概率不会用……

如果觉得有用,就请分享到朋友圈吧!

点个在看 paper不断!

CV业务落地用Transformer吗?相关推荐

  1. 2021年,作为算法工程师的你们会在CV业务上用Transformer吗?

    点上方计算机视觉联盟获取更多干货 仅作学术分享,不代表本公众号立场,侵权联系删除 转载于:作者丨花花,OLDPAN 来源丨知乎问答 编辑丨极市平台 AI博士笔记系列推荐 周志华<机器学习> ...

  2. 2021年,作为算法工程师的你们会在CV业务落地上用Transformer吗?

    作者丨花花,OLDPAN 来源丨知乎问答 编辑丨极市平台 [导读]众所周知,Transformer 已经日常在CV学术领域"杀疯了",那么在工业领域情况如何呢? 来源链接:http ...

  3. 产品经理 - 产品设计方法论业务落地部分_包括流程产品文档方法论需求设计方法论

    整体 - 产品设计方法论思维导图 个人整理,存在异议大家可以讨论下 业务落地方法论 在进行了需求收集以及需求分析后,针对收集到的需求以及对应的分析结论后,需针对当前的需求点进行开发落地,核心即为两点, ...

  4. 跟技术大咖涨姿势!前沿CV技术+落地应用练就CV界的最强王者

    当新冠肺炎疫情成为2020开年最大"黑天鹅事件",全民"抗疫"的力量汇聚在一起,AI也随之迅速加入"战场". 无论是商场中的AI测温.地铁站 ...

  5. 智能标注、电力和地下管网巡检,CV算法落地方案

    EasyDL产业应用系列·安全生产及数据处理公开课,课后知识点笔记已修炼完毕,没参加直播课程的小伙伴,可通过实录完整解析AI巡检业务场景和定制AI解决方案,小时级成功变身AI应用专家! 同时 5月27 ...

  6. 中信建投首席分析师点评百度Q2财报:AI业务落地迅速值得期待

    8月1日,百度(NASDAQ:BIDU)公布了2018年第二季度未经审计的财务报告.中信建投证券传媒互联网团队首席分析师曾荣飞在对百度Q2财报内容进行点评时认为:百度的收入和Non-Gaap利润均超预 ...

  7. 斐讯携手思科建设数据中心 驱动区块链业务落地

    随着移动互联网.人工智能.自动驾驶.智能家居.智能穿戴等系列创新技术产生,海量数据正不断涌现,通过对大数据的多维分析,企业可以利用大数据产生的价值指导企业的重要决策规划,而云计算数据中心战略正是斐讯& ...

  8. 华东电脑申威服务器_华东电脑(600850):申威服务器首批量产下线 国产化业务落地里程碑事件[配资公司会议室]...

    事务:凭据电科软信子团体官网,12 月30 日上午,中国电科在沪举办申威服务器首批量产下线典礼暨公司旗下华诚金锐互助火伴签约勾当. 点评: 华诚金锐是公司配合倡议成立,定位于国产化高机能通用服务器研制 ...

  9. 3.知识图谱业务落地技术推荐之国内知识图谱平台汇总(竞品)[阿里、腾讯、华为等】

    知识图谱专栏简介:数据增强,智能标注,文本信息抽取(实体关系事件抽取).知识融合算法方案.知识推理.模型优化.模型压缩技术等

最新文章

  1. rman备份后为什么要同时备份归档日志
  2. 济宁医学院计算机专业好就业吗,山东这3所医学院实力强,就业率高,中等生可捡漏...
  3. python 中如何判断list中是否包含某个元素
  4. 图像滤波与滤波器基础知识
  5. 客制化键盘键位修改_IQUNIX Slim87 RGB机械键盘评测
  6. 研究称:苹果开始感受到全球芯片短缺影响,但三星等受影响更大
  7. (原創) Verilog入門書推薦2:數位系統實習 Quartus II (SOC) (Verilog)
  8. Halcon 4点单标相机外参
  9. Java从入门到精通 第19章 异常的捕获和处理
  10. revi插件使用方法| 如何在Revit中修改CAD图纸
  11. 论文阅读《A Survey on Deeping Learning In Medical Image Analysis》
  12. dorado7.x控制显示隐藏
  13. built a JNCIS LAB系列:Chapter 1 Autonomous System Paths v1.0
  14. Windows远程桌面连接保姆级教学
  15. J - 山峰和山谷 Ridges and Valleys
  16. 计算机基础知识教程excel试题,计算机基础知识试题
  17. ijk基于exo_github上十二款最著名的Android播放器开源项目
  18. MySQL建立连接慢的处理
  19. 基于形状图像检索的曲率尺度空间描述符与傅立叶描述子的比较研究——18.07.14
  20. 谷歌浏览器调用打印机不预览

热门文章

  1. SqlParameter参数方式操作数据库(存储过程)
  2. 用C#创建Windows服务(Windows Services)
  3. 技术图文:如何在Python中定义二维数组?
  4. 如何利用 C# 爬取「当当 - 计算机与互联网图书销量榜」!
  5. boxFilter 滤波器实现
  6. 超 40W 奖金池等你来战!第二届“长沙银行杯”腾讯云启创新大赛火热来袭!...
  7. 融云任杰:强互动,RTC 下一个“爆点”场景 | 拟合
  8. 一站式了解多模态、金融、事理知识图谱构建指南 | AI ProCon 2020
  9. AI、5G、小程序、AIoT纷纷迎来高峰,下一步开发者们要怎么办?
  10. AI时代,中国技术创新如何弯道超车?