low-level 的视觉模型要在生产环境的服务端部署使用,还是有一些工作要做的。当然,本文不涉及在移动端的部署,我理解移动端模型部署很核心的工作是模型压缩(量化、枝剪和蒸馏),这块我涉及不算很深入,只搞过一点量化和枝剪,就不展开描述了。

3.2.1 推理框架

主要试了三个推理框架:阿里的MNN、facebook的libtorch和nvidia的TensorRT

a. MNN

MNN相对而言成熟度稍差些,优势是开源,有问题可以自己看代码,甚至做一点点修改,我在windows上跟MingW32结合编译MNN的库开始就遇到问题,后面做了一点修改,就能跑了,这个当时还给MNN提了个issue ,总的来说,我理解MNN可能更适合移动端推理,我的场景可能不是特别符合

b. libtorch

libtorch 和 pytorch 系出同门,是其的 c/c++ 版本,也是开源的,这些特性决定了相对而言libtorch对 pytorch模型支持度相对友好,虽然跑通过程中也有一些坑(主要是跟ffmpeg融合编译的时候比较折腾),但回头看基本也都还好,但相比较 tensorRT,实测下来libtorch 性能会差不少,所以最终我选择的还是 tensorRT作为最终版本的推理引擎

c. tensorRT

TRT实测下来性能最好,应该跟我默认开了量化有关,它的缺点之一是它不开源,真遇到问题,比较容易抓瞎没办法,网上搜索出来的资料良莠不齐,比较难搞,不过跑通的话还是比较香的。

3.2.2 推理过程

pytorch训练产生的是 pth文件,通过python脚本可将其转为 onnx文件,然后使用 trt 库函数再转成 *.trt 文件,最后推理用的就是这个 *.trt 文件了

这里值得指出的是,不同显卡、不同硬件,通用的是 onnx文件,而非 *.trt,也就是说,*.trt 是硬件相关的(应该本质就是显卡),它可以理解为显卡定制优化后的模型文件供TRT使用,这应该也是其可以比 libtorch 性能更好的原因吧。

3.2.3 显卡

实际跑过的显卡还是比较多的,实测下来,性价比最高的感觉是 3070/3090 系列,比V100 性能稍差一点,但价格差距就更大了,我理解这跟超分、降噪这类 low-level  模型特性有关

画质增强概述-3.2-AI增强实践之推理与部署相关推荐

  1. 哔哩哔哩视频云画质与窄带高清AI落地实践

    视频赛道卷到下半场,一定会面临体验与成本的对抗,尤其是在行业大环境"过冬"的背景下,想要在有限带宽下获得最佳的画质观感变得异常具备挑战性.从视频云业务场景的视角来看,如何有效解决c ...

  2. 画质增强概述-4-传统方法增强实践

    传统方法和AI方法是一个互相补充的关系,要看具体的场景和视频类型,一般而言,传统方法性能上相对比AI方法更好些,对算力要求相对低一些,成本上自然也更低 传统方法的保边滤波(如导向滤波等).锐化.对比度 ...

  3. 画质增强概述-3.1-AI增强实践之超分训练

    三 画质增强的AI增强实践 画质增强处理从方法上可以分为传统方法和深度学习(AI)方法,他们是互相补充的关系,传统方法相对而言性能会好些,AI方法吃GPU.吃算力,很多课题AI方法效果远非传统方法科比 ...

  4. 画质增强概述-3.3-AI增强实践之服务形态

    low-level 视觉任务输入输出一般都是RGB数据,那么在生产环境,除非在移动端增强后直接显示,否则基本是需要对数据进行压缩,然后存储或者传输.服务端的增强服务,多数是把增强服务封装为ffmpeg ...

  5. 画质提升了! LR增强细节_Lightroom 开启 AI 照片细节强化:画面清晰度提升 30%

    使用超分辨率,画质提升了,白给图也能救了,能拍一亿像素了,吗? ​​Adobe在最新版本的Lightroom CC,以及Lightroom Classic CC中更新了超分辨率影像的功能,旨在通过AI ...

  6. 画质增强概述-2-应用场景

    二 画质增强应用场景 画质增强应用场景是非常广泛的,本质上,"谁会嫌画质太好了呢",随着传输.显示等基础设施和硬件的进步,画质增强的应用一定会越来越广泛,我这里只是简单介绍一下几个 ...

  7. 视频编解码优化以及与AI的实践结合

    RealNetworks是流媒体类别的发明者,改变了音频和视频内容在各种设备和全世界消费的方式.在编解码市场的大环境下,RealNetworks推出了新一代的视频压缩算法RMHD,专为下一代的高清流媒 ...

  8. 智能化软件开发微访谈·第二十期暨2022新年特辑:AI软件架构实践

    CodeWisdom 智能化软件开发沙龙是复旦大学CodeWisdom团队参与组织的专注于代码大数据与智能化软件开发的学术和技术沙龙,面向相关领域的学术界研究者和工业界实践者,通过各种线上和线下交流活 ...

  9. 从微信AI首席顾问到金融文档智能,一位中科院计算机科学家AI产品化实践

    从微信AI首席顾问到金融文档智能,一位中科院计算机科学家AI产品化实践 本文作者:伊莉 2017-08-14 10:18 导语:"我的研究思路是扎根某一领域,如金融,并探索一些实际问题,再从 ...

最新文章

  1. php原生开发规范,php开发规范
  2. mysqld与mysqld_safe的区别
  3. LINUX--特殊权限SUID,SGID,Sticky
  4. 电子计算机 俗称 它是一种具有,2013年计算机一级B试题模拟1
  5. ug不能自动启动服务器,没有足够的权限启动系统服务解决方法
  6. 学习Spring Boot:(七)集成Mybatis
  7. Vue 全家桶 + Electron 开发的一个跨三端的应用 1
  8. 同一页面实现多个Tab选项卡功能
  9. kali升级python3.6_kali下将Python2.x切换至Python3.x
  10. 小米6X 线刷兼救砖_解账户锁_纯净刷机包_教程
  11. selenium对Alert弹框的多种处理
  12. Android shell 授权文件执行权限
  13. 整站SEO优化方案:整站优化的方案的流行格式
  14. 初识Flutter中的Layer
  15. 20189200余超 2018-2019-2 移动平台应用开发实践第三周作业
  16. Everything工具设置书签
  17. 一摞烙饼的排序问题--读书笔记(2)
  18. ctfshow XSS web316-web333 wp
  19. 景深(perspective)
  20. 数据库学习笔记:事务的特性和隔离级别

热门文章

  1. (一)OS——计算机系统概述
  2. php程序+打印机,php程序怎么调用打印机
  3. 学计算机方面该怎样保养眼睛,电脑工作者应该怎样保护眼睛?
  4. BIM建模|关于Revit的42个知识点
  5. AAA认证、授权、计费
  6. 方舟生存进化服务器文件设置,方舟:生存进化 参数文件ini设置教程 ini设置
  7. leetcode 39. 组合总和 40. 组合总和 II
  8. 三星率先推出全球首款可3G上网Gear S智能手表
  9. Unity的VRTK捡拾物体学习笔记
  10. 湖北省十堰市地方税务局网络存储设备公开招标公告