1.什么是通道?
通道在我看来可以简单理解为图像的深度。通过阅读一些帖子,我觉得有两个总结对理解通道很有帮助,这里在下面介绍一下。
计算机在存储图片时是以数字矩阵的形式存储,例如我们最常见的彩色图片,RNG格式,它包含红,黄,蓝三个通道,而灰色图片只有一个通道。
1.输入通道数等于卷积核通道个数
例如当我们输入的图片为三通道时,那么卷积核也会有三个通道,就像上述图片,最左边的三个矩阵是一个图片的三个通道(因为计算机上是以数字矩阵存储),与这张图片相乘的是一个1*1的三通道卷积核。
为了让图像的三个通道和卷积核分别进行点积并相加得到一个矩阵,即一个特征图,所以卷积核的通道也要有三个,为了和图像的每个通道都进行运算。
2.卷积核个数 等于 输出通道个数
卷积核的数量决定输出的通道数,比如说现在有一张像素为16*16的三通道图片(16*16*3),其实这张照片就由三个16*16的矩阵组成,如果这时我们有256个3*3*3的卷积核,其实就是每个卷积核由3个3*3的矩阵,有256个这样的卷积核。那么这张16*16*3的图片要和256个3*3*3的卷积核都进行点积并相加得出特征图,即得到的特征图有256个,即卷积核的个数,也是输出通道的个数。
2.为什么要增加通道
在一张照片中可能有很多信息,比如人,动物....,我们人眼可以一下子就分辨出来,但是计算机不可以,他要进行特征提取,也是卷积的第一个操作。
我们增加通道数就代表着增加特征,而造成通道数增加的操作其实就是卷积核的增加,不同的卷积核可以提取到不同特征,比如说平滑卷积核,它可以让整个图像更加平滑清晰,还比如增加水平边界过滤器,垂直边界过滤器(本质都是卷积核),让图像的矩阵和卷积核进行点积相加,得到不同的矩阵,即不同的特征图,这些特征图越多,越利于计算机学习,这将教会计算机识别特征。
因为不同的卷积核可以分辨出不同的特征,所以增加卷积核的个数很必要,计算机通过利用这些特征图,来最终得到结论,分辨出图像的事物到底是什么。
3.补充
池化操作是为了在降低像素的同时保存重要信息,而降低像素也十分必要,要通过降低像素来减少计算机的内存消耗。
网络中常常增加通道同时降低像素,但如果不断降低像素而不增加通道,那么图片通过激活函数等操作后很可能会遗漏重要信息,那么这个网络的训练效果可能就会不理想。
本文转载自: https://blog.csdn.net/qq_54641516/article/details/127079382
版权归原作者 -day day up- 所有, 如有侵权,请联系我们删除。
版权归原作者 -day day up- 所有, 如有侵权,请联系我们删除。