stn算子_深度学习常用算子(二)
1、Tensor维度变换
1)Flatten
作用:将输入tensor中从start_axis维度到end_axis维度合并为1维
2)Reshape
作用:将输入Tensor描述转换为新的shape
3)FreespaceExtract
作用:将h维变成1,其他维度不变,从而完成对h的采样,采样值所在位置由输入的index参数决定
4)Pack
作用:Pack算子为TensorFlow原生算子,最新的版本已经改名为:Stack。该算子以指定的轴axis,将一个维度为R的张量数组转变成一个维度为R+1的张量。
5)Pad
作用:进行数据扩充
6)Permute
作用:调整Tensor的输入维度顺序
7)ShuffleChannel
作用:调整C维的排序
使用网络:ShuffleNet
8)Title
作用:将输入数据在每个维度上复制指定次数来生成输出数据
2、Tensor单个元素运算
1)Rsqrt
公式:y = 1 / sqrt{x}
2)Scale
公式:y(x)=scale*x+bias
3)AbsVal
公式:y(x)=|x|
4)Power
公式:f(x)= (scale * x + shift) ^ power
3、分类
Softmax
公式:
作用:通常作为分类网络的最后一层,输出每类的概率
4、画框
1)ClipBoxes
作用:将输入的框坐标限制在[0,img_w-1]和[0,img_h-1]之间。
2)DecodeBoxes
作用:将输入框的长宽坐标转换为描点坐标(框中心点坐标和长宽),然后进行修正,修正后再替换回长宽坐标
3)DetectPostProcess
作用:
(1)对输入的框进行修正;
(2)按照得分进行排序;
(3)使用NMS进行过滤;
(4)每个分类取前N个框输出。
4)FasterRcnnPredictions
作用:获取得分最高的N个框,需要进行NMS处理。
使用网络:MaskRcnn
5)FSRDectionOutput
作用:获取得分最高的N个框,需要进行NMS处理
输入数据:每个分类的得分数据、roi坐标、roi偏移、feature map的长和宽
使用网络:FasterRcnn
6)GenerateRPNProposals
作用:根据输入rois坐标和得分,输出排序和NMS处理后的前N个框,框坐标形式为左上角和右下角
使用网络:Mask Rcnn
7)Proposal
作用:根据锚点前后得分、锚点偏移、原始图片的长宽缩放,来获取得分最高的N个预选框;
特点:对特征图上的每个点,生成scale*ratio个固定大小的窗口;即候选窗口是该算子生成的。
8)SsdDetectionOutput
作用:用来生成预测框相对原图的真实坐标,并对所有预测框进行过滤,得到最终物体检测的结果。输出的每个预测框的信息包括image id ,lable, confidence以及四个坐标值。
使用网络:SSD
8)SsdPriorBox
作用:生成预选框
使用网络:SSD
5、拼接
Concat:实现多个算子的拼接
6、旋转/缩放/平移/剪切
spatial transform
参考:https://blog.csdn.net/qq_39422642/article/details/78870629
作用:在CNN之前对feature map进行旋转、缩放、平移、剪切等操作
使用网络:Spatial Transformer Networks(STN)
————————————————
版权声明:本文为CSDN博主「gapostal」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/zhuhaodonglei/article/details/100014178
stn算子_深度学习常用算子(二)相关推荐
- 深度学习(二)——深度学习常用术语解释, Neural Network Zoo, CNN, Autoencoder
Dropout(续) 除了Dropout之外,还有DropConnect.两者原理上类似,后者只隐藏神经元之间的连接. 总的来说,Dropout类似于机器学习中的L1.L2规则化等增加稀疏性的算法,也 ...
- 前几帧预测 深度学习_使用深度学习从十二导联心电图预测心律失常
上集讲到 使用深度学习 从单导联预测房颤 这一集 将继续讨论该问题 单导联心电图 对心律失常的预测作用 非常有限 因为 单导联的信号很有限 临床上需要结合 多导联心电图 判断 心律失常的类型 这一集的 ...
- 深度学习 图像分类_深度学习时代您应该阅读的10篇文章了解图像分类
深度学习 图像分类 前言 (Foreword) Computer vision is a subject to convert images and videos into machine-under ...
- 深度学习常用数学知识
深度学习常用数学知识 为什么图片能被计算机读取?为什么我们可以用CNN对成千上万中图片进行分类,这背后的原理是什么?在了解原理之前,先给大家补点数学知识.因为无论是深度学习还是机器学习,背后都是有一些 ...
- 深度学习领域专业词汇_深度学习时代的人文领域专业知识
深度学习领域专业词汇 It's a bit of an understatement to say that Deep Learning has recently become a hot topic ...
- ann人工神经网络_深度学习-人工神经网络(ANN)
ann人工神经网络 Building your first neural network in less than 30 lines of code. 用不到30行代码构建您的第一个神经网络. 1.W ...
- 深度学习常用python库学习笔记
深度学习常用python库学习笔记 常用的4个库 一.Numpy库 1.数组的创建 (1)np.array() (2)np.zeros() (3)np.ones() (4)np.empty() (5) ...
- 自动驾驶深度学习常用中英文对照表
自动驾驶深度学习常用中英文对照表 A B C D E F G H I J K L M N O P Q R S T U V W Z A 英文 中文 词性 activation 激活值 n,名词 acti ...
- 深度学习常用评价指标
版权声明:本文为CSDN博主「ZONG_XP」的原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接及本声明. 原文链接:https://blog.csdn.net/zong59 ...
最新文章
- oracle home 命令,$ORACLE_HOMEbin目录下所有命令的使用方法及命令详解
- 处理您的请求时发生错误(Web Dynpro ABAP)
- MySQL数据库中导入导出方法以及工具介绍
- sqlserver date转nvarchar_数据库干货:整理SQLServer非常实用的脚本
- css 跳动的心_如何用纯CSS为您的情人打造一颗跳动的心
- PHP闭包(Closure)初探(转载 http://my.oschina.net/melonol/blog/126694?p=2#comments)
- spring boot java app_利用spring boot创建java app
- UIView 的旋转和缩放
- python兼职程序员工资-Python 程序员的工资能有多高?
- java scjp 试题_JAVA认证历年真题:SCJP考试真题和解析[1]
- Jackson –将JSON数组字符串转换为List
- 软件测试最常见的面试题了解一下
- 【字节前端青训营】跟着月影学JavaScript——前端代码优化三大原则之各司其职,夜间模式小案例
- 2.6-使用C#Winform开发Tcp/Udp网络小助手(含步骤和源码)
- 【PC自动化测试-11】窗口控件的类型分类
- React Native 0.44.3 ----------微信h5支付
- this指向 改变this指向
- MTK camera flashlight bring up
- bayaim_当前国内外Hadoop的实际使用案例
- AMD推动高性能数据中心计算迈进新世代
热门文章
- H5 微信公众号 授权登录 前后端分离篇(后端02)
- linux-centos7 常用的基本命令--文件内容查看、硬链接和软链接
- v-if v-show区别(面试题)
- 编写一个C程序,实现以下功能:输入n个人的身高,然后从n个人中选出身高差值最小的两个人作为礼仪(如果差值相同的话,选取其中最高的两个人),要求输出两个礼仪的身高。
- python获取路径下所有文件_Python获取路径下所有文件名
- oracle导入导出版本规则,oracle expdp impdp 导出导入(支持高版本到低版本)
- html添加子节点方法,HTML DOM appendChild() 方法
- mac上用qt调用自己生成的qt动态库,该动态库又依赖第三方库
- C语言 数组排序 – 冒泡法排序 - C语言零基础入门教程
- c语言变长参数 第一个参数必须吗,一种使用变长参数为C程序构造灵活回调函数的方法...