知乎:深度学习中的多尺度模型设计
知乎:计算机视觉中的多尺度模型都有哪些设计?
CSDN:多尺度理解
什么是多尺度?
所谓多尺度,实际就是对信号的不同粒度的采样。
通常在不同的尺度下我们可以观察到不同的特征,从而完成不同的任务。
粒度更小/更密集的采样可以看到更多的细节,粒度更大/更稀疏的采样可以看到整体的趋势。
使用多尺度,就可以提取更全面的信息,既有全局的整体信息,又有局部的详细信息。
- 如果要完成的任务只是判断图中是否有前景,那么12×8的图像尺度就足够了。
- 如果要完成的任务是识别图中的水果种类,那么64×48的尺度也能勉强完成。
- 如果要完成的任务是后期合成该图像的景深,则需要更高分辨率的图像,比如640×480。
换个角度理解多尺度
- 如左图,图像中又站台有车有人,在整张图像上提取特征,提取的维全局特征;
- 如右图,是从原图中提取的局部区域,其缩放与原图大小一致,再提取其特征,则是原图的某一局部区域的详细特征。
使用多尺度,就可以提取更全面的信息,既有全局的整体信息,又有局部的详细信息。
版权归原作者 MengYa_DreamZ 所有, 如有侵权,请联系我们删除。