深度学习的通道到底是什么？有什么用？（小白可看）

1.什么是通道？

通道在我看来可以简单理解为图像的深度。通过阅读一些帖子，我觉得有两个总结对理解通道很有帮助，这里在下面介绍一下。

    计算机在存储图片时是以数字矩阵的形式存储，例如我们最常见的彩色图片，RNG格式，它包含红，黄，蓝三个通道，而灰色图片只有一个通道。

1.输入通道数等于卷积核通道个数

    例如当我们输入的图片为三通道时，那么卷积核也会有三个通道，就像上述图片，最左边的三个矩阵是一个图片的三个通道（因为计算机上是以数字矩阵存储），与这张图片相乘的是一个1*1的三通道卷积核。
    为了让图像的三个通道和卷积核分别进行点积并相加得到一个矩阵，即一个特征图，所以卷积核的通道也要有三个，为了和图像的每个通道都进行运算。

2.卷积核个数等于输出通道个数

    卷积核的数量决定输出的通道数，比如说现在有一张像素为16*16的三通道图片（16*16*3），其实这张照片就由三个16*16的矩阵组成，如果这时我们有256个3*3*3的卷积核，其实就是每个卷积核由3个3*3的矩阵，有256个这样的卷积核。那么这张16*16*3的图片要和256个3*3*3的卷积核都进行点积并相加得出特征图，即得到的特征图有256个，即卷积核的个数，也是输出通道的个数。

2.为什么要增加通道

    在一张照片中可能有很多信息，比如人，动物....，我们人眼可以一下子就分辨出来，但是计算机不可以，他要进行特征提取，也是卷积的第一个操作。
    我们增加通道数就代表着增加特征，而造成通道数增加的操作其实就是卷积核的增加，不同的卷积核可以提取到不同特征，比如说平滑卷积核，它可以让整个图像更加平滑清晰，还比如增加水平边界过滤器，垂直边界过滤器（本质都是卷积核），让图像的矩阵和卷积核进行点积相加，得到不同的矩阵，即不同的特征图，这些特征图越多，越利于计算机学习，这将教会计算机识别特征。
    因为不同的卷积核可以分辨出不同的特征，所以增加卷积核的个数很必要，计算机通过利用这些特征图，来最终得到结论，分辨出图像的事物到底是什么。

3.补充

    池化操作是为了在降低像素的同时保存重要信息，而降低像素也十分必要，要通过降低像素来减少计算机的内存消耗。
    网络中常常增加通道同时降低像素，但如果不断降低像素而不增加通道，那么图片通过激活函数等操作后很可能会遗漏重要信息，那么这个网络的训练效果可能就会不理想。

标签： cnn 人工智能神经网络

本文转载自: https://blog.csdn.net/qq_54641516/article/details/127079382
版权归原作者 -day day up- 所有，如有侵权，请联系我们删除。

深度学习的通道到底是什么？有什么用？（小白可看）

1.什么是通道？

1.输入通道数等于卷积核通道个数

2.卷积核个数等于输出通道个数

2.为什么要增加通道

3.补充

发表评论

“深度学习的通道到底是什么？有什么用？（小白可看）”的评论:

关于作者

overfit同步小助手

相关阅读

文章导航

深度学习的通道到底是什么？有什么用？（小白可看）

1.什么是通道？

1.输入通道数等于卷积核通道个数

2.卷积核个数 等于 输出通道个数

2.为什么要增加通道

3.补充

发表评论

“深度学习的通道到底是什么？有什么用？（小白可看）”的评论:

关于作者

overfit同步小助手

相关阅读

文章导航

2.卷积核个数等于输出通道个数