SKnet论文解读

本文讲述sknet的核心部分:自适应性的注意力编码机制

SKNet 对不同输入使用的卷积核感受野不同,参数权重也不同,可以自适应的对输出进行处理

注:本人才疏学浅,文章难免有疏漏之处,仅给初学者阅读交流,大牛轻喷.

开始之前的题外话

    说来也算有趣,最近读了几个关于CV领域的paper,有的号称其idea来源于神经科学,比如SIM-AM![](https://img-blog.csdnimg.cn/657e15f144094e35a5a355e900c444e4.png?x-oss-process=image/watermark,type_d3F5LXplbmhlaQ,shadow_50,text_Q1NETiBA5ZCD5bCP6Iqx55qE6a2U546L,size_20,color_FFFFFF,t_70,g_se,x_16)的三维特征推断(这个其实没怎么看懂),言归正传,我们看一看sknet吧

1.神经科学背景

比如说inception模型的'宽度'

于是提出了sknet,不同大小的感受视野（卷积核）对于不同尺度的目标会有不同的效果。尽管 Inception 这样的增加了多个卷积核来适应不同尺度图像，但是卷积核权重相同,参数就是被计算好的了.SKNet 对不同输入使用的卷积核感受野不同,参数权重也不同,可以自适应的对输出进行处理

sknet网络主要由 Split、Fuse、Select 三部分组成。

原文:'为了使神经元能够自适应地调整它们的 RF 大小，我们提出了一种自动选择操作，即“选择性内核”（SK）卷积，在具有不同内核大小的多个内核中。具体来说，我们通过三个运算符实现 SK 卷积——Split、Fuse 和 Select，如图 1 所示，其中显示了两个分支的情况。因此在这个例子中，只有两个内核大小不同的内核，但是很容易扩展到多个分支的情况。'