当前位置:首页 > 问答百科 > 正文内容

卷积的基本原理(一文了解各种卷积结构原理及优劣)

福瑞号2022-12-02 08:18:14问答百科160
王小新 编译自 Medium
量子位 出品 | QbitAI
卷积神经网络作为深度学习的典型网络,在图像处理和计算机视觉等多个领域都取得了很好的效果。
Paul-Louis Prve在Medium上通过这篇文章快速地介绍了不同类型的卷积结构(Convolution)及优势。为了简单起见,本文仅探讨二维卷积结构。
卷积
首先,定义下卷积层的结构参数。
卷积的基本原理(一文了解各种卷积结构原理及优劣)-图1
卷积核为3、步幅为1和带有边界扩充的二维卷积结构
卷积核大小(Kernel Size):定义了卷积操作的感受野。在二维卷积中,通常设置为3,即卷积核大小为3×3。
步幅(Stride):定义了卷积核遍历图像时的步幅大小。其默认值通常设置为1,也可将步幅设置为2后对图像进行下采样,这种方式与最大池化类似。
边界扩充(Padding):定义了网络层处理样本边界的方式。当卷积核大于1且不进行边界扩充,输出尺寸将相应缩小;当卷积核以标准方式进行边界扩充,则输出数据的空间尺寸将与输入相等。
输入与输出通道(Channels):构建卷积层时需定义输入通道I,并由此确定输出通道O。这样,可算出每个网络层的参数量为I×O×K,其中K为卷积核的参数个数。例,某个网络层有64个大小为3×3的卷积核,则对应K值为 3×3 =9。
空洞卷积
空洞卷积(atrous convolutions)又名扩张卷积(dilated convolutions),向卷积层引入了一个称为 “扩张率(dilation rate)”的新参数,该参数定义了卷积核处理数据时各值的间距。
卷积的基本原理(一文了解各种卷积结构原理及优劣)-图2
卷积核为3、扩张率为2和无边界扩充的二维空洞卷积
一个扩张率为2的3×3卷积核,感受野与5×5的卷积核相同,而且仅需要9个参数。你可以把它想象成一个5×5的卷积核,每隔一行或一列删除一行或一列。
在相同的计算条件下,空洞卷积提供了更大的感受野。空洞卷积经常用在实时图像分割中。当网络层需要较大的感受野,但计算资源有限而无法提高卷积核数量或大小时,可以考虑空洞卷积。
转置卷积
转置卷积(transposed Convolutions)又名反卷积(deconvolution)或是分数步长卷积(fractially straced convolutions)。
反卷积(deconvolutions)这种叫法是不合适的,因为它不符合反卷积的概念。在深度学习中,反卷积确实存在,但是并不常用。实际上,反卷积是卷积操作的逆过程。你可以这么理解这个过程,将某个图像输入到单个卷积层,取卷积层的输出传递到一个黑盒子中,这个黑盒子输出了原始图像。那么可以说,这个黑盒子完成了一个反卷积操作,也就是卷积操作的数学逆过程。
转置卷积与真正的反卷积有点相似,因为两者产生了相同的空间分辨率。然而,这两种卷积对输入数据执行的实际数学运算是不同的。转置卷积层只执行了常规的卷积操作,但是恢复了其空间分辨率。
卷积的基本原理(一文了解各种卷积结构原理及优劣)-图3
卷积核为3、步幅为2和无边界扩充的二维卷积结构
举个例子,假如将一张5×5大小的图像输入到卷积层,其中步幅为2,卷积核为3×3,无边界扩充。则卷积层会输出2×2的图像。
若要实现其逆过程,需要相应的数学逆运算,能根据每个输入像素来生成对应的9个值。然后,将步幅设为2,遍历输出图像,这就是反卷积操作。
卷积的基本原理(一文了解各种卷积结构原理及优劣)-图4
卷积核为3×3、步幅为2和无边界扩充的二维转置卷积
转置卷积和反卷积的唯一共同点在于两者输出都为5×5大小的图像,不过转置卷积执行的仍是常规的卷积操作。为了实现扩充目的,需要对输入以某种方式进行填充。
你可以理解成,至少在数值方面上,转置卷积不能实现卷积操作的逆过程。
转置卷积只是为了重建先前的空间分辨率,执行了卷积操作。这不是卷积的数学逆过程,但是用于编码器-解码器结构中,效果仍然很好。这样,转置卷积可以同时实现图像的粗粒化和卷积操作,而不是通过两个单独过程来完成。
可分离卷积
在可分离卷积(separable convolution)中,可将卷积核操作拆分成多个步骤。卷积操作用y=conv(x, k)来表示,其中输出图像为y,输入图像为x,卷积核为k。接着,假设k可以由下式计算得出:k=k1.dot(k2)。这就实现了一个可分离卷积操作,因为不用k执行二维卷积操作,而是通过k1和k2分别实现两次一维卷积来取得相同效果。
卷积的基本原理(一文了解各种卷积结构原理及优劣)-图5
X、Y方向上的Sobel滤波器
Sobel算子通常被用于图像处理中,这里以它为例。你可以分别乘以矢量[1,0,-1]和[1,2,1]的转置矢量后得到相同的滤波器。完成这个操作,只需要6个参数,而不是二维卷积中的9个参数。
这个例子说明了什么叫做空间可分离卷积,这种方法并不应用在深度学习中,只是用来帮你理解这种结构。
在神经网络中,我们通常会使用深度可分离卷积结构(depthwise separable convolution)。
这种方法在保持通道分离的前提下,接上一个深度卷积结构,即可实现空间卷积。接下来通过一个例子让大家更好地理解。
假设有一个3×3大小的卷积层,其输入通道为16、输出通道为32。具体为,32个3×3大小的卷积核会遍历16个通道中的每个数据,从而产生16×32=512个特征图谱。进而通过叠加每个输入通道对应的特征图谱后融合得到1个特征图谱。最后可得到所需的32个输出通道。
针对这个例子应用深度可分离卷积,用1个3×3大小的卷积核遍历16通道的数据,得到了16个特征图谱。在融合操作之前,接着用32个1×1大小的卷积核遍历这16个特征图谱,进行相加融合。这个过程使用了16×3×3+16×32×1×1=656个参数,远少于上面的16×32×3×3=4608个参数。
这个例子就是深度可分离卷积的具体操作,其中上面的深度乘数(depth multiplier)设为1,这也是目前这类网络层的通用参数。
这么做是为了对空间信息和深度信息进行去耦。从Xception模型的效果可以看出,这种方法是比较有效的。由于能够有效利用参数,因此深度可分离卷积也可以用于移动设备中。
相关阅读
原文:https://medium.com/towards-data-science/types-of-convolutions-in-deep-learning-717013397f4d
更多卷积动画:https://github.com/vdumoulin/conv_arithmetic
【完】

扫描二维码推送至手机访问。

版权声明:本文由福瑞号发布,如需转载请注明出处。

本文链接:https://www.furui.com.cn/8234.html

“卷积的基本原理(一文了解各种卷积结构原理及优劣)” 的相关文章

少年的你的结局解析(少年的你最后结局没看懂)

少年的你的结局解析(少年的你最后结局没看懂)

两个人最终双双步入牢狱,作为少年的你最后结局,容易让观众产生多种理解和想法,因而会让人产生看不懂的感觉。其实我们可以从他们赢了和美好的结局两个角度分析一下这个大结局,并从中感受影片饱含的深意。 1、最后结局。结尾处,成年小北不再穿着帽衫,低头沉默;他昂头走路,面带笑意,干净明朗,似乎还看了眼监控?少...

填写完整的QQ群资料该怎样填写(写材料无从下笔怎么办)

填写完整的QQ群资料该怎样填写(写材料无从下笔怎么办)

作为一名体制内“打工人”,你是不是也有这样的体验: 有点笔头功夫的人,在机关单位最“抢手”;写不好材料的人,到哪个科室都不受欢迎。 可让你苦恼的是,自己却是材料“小白”一枚: 接到领导交办的材料任务就发懵,不知从何下笔,对着电脑抓耳挠腮、苦思半天,屏幕上还只“敲”了一个标题。 好不容易像挤牙膏似地“...

甄嬛配音演员是谁(季冠霖:当之无愧的甄嬛配音演员)

甄嬛配音演员是谁(季冠霖:当之无愧的甄嬛配音演员)

季冠霖是一名八零后女生,在天津师范就学期间,她就开始接触到大量的配音工作,那个时期她主要是为多部外来译制片提供配音工作,为她今后的职业生涯奠定了一份雄厚的基础,但是真正让她在配音行业迈出第一步的,还是在电视剧《张大千》中精彩的配音表现。 许多人可能并不熟悉季冠霖,这并不奇怪,配音工作者本身就是说...

国际上一桶油多少升(石油以桶为单位)

国际上一桶油多少升(石油以桶为单位)

经历了2020年的油价大跌,2021年以来的油价可以说快速回升,即使没有上涨也是搁浅。而在这油价的背后,经常也会有一个问题。那就是,液体计量单位往往都是升或者吨,为什么石油却是桶呢? 文:刘金朝 石油这一资源对于任何一个国家来说,重要性都是不容忽视的。毕竟哪个国家石油资源丰富的话,意味着光是靠这一资...

一国两制坚持哪两点(全文来了)

一国两制坚持哪两点(全文来了)

7月1日上午,庆祝香港回归祖国25周年大会暨香港特别行政区第六届政府就职典礼在香港会展中心举行。习近平主席监誓,李家超宣誓就任香港特别行政区行政长官。 中共中央总书记、国家主席、中央军委主席习近平在庆祝香港回归祖国25周年大会暨香港特别行政区第六届政府就职典礼上发表重要讲话。 习近平表示,“一国...

林书豪的祖籍在哪里(如果再选择)

林书豪的祖籍在哪里(如果再选择)

没有比赛,什么都没有,我们真的有些无聊!没有比赛可聊,我们聊聊些别的吧,聊聊如果北京男篮下赛季放弃林书豪,他会去哪里呢?看似天马行空,不切实际,但是其实还挺有趣的,可能你还会了解到一些林书豪以前不曾知道的信息。 首先,北京男篮下赛季放弃林书豪的可能性不大!林书豪虽然没有了当年林疯狂的神奇,进攻能力下...