最近在看一些代码时,发现以前学习的函数有些遗忘了,在此复习一下,也希望能给大家带来一点有用的知识。
这个RandomResizedCrop()函数跟ToTensor()这类函数一样,在torchvision中的transforms
包里面。一般来说,用于图片的preprocess和data augmentation。
import torchvision
trans = torchvision.transforms.RandomResizedCrop((224,224),scale=(0.8,1.0),ratio=(1.0,1.0))
RandomResizeCrop()这个函数,最常用的三个参数是size,scale,和ratio
首先size,是你的图片经过这个函数最后得到的图片的大小;如果这个参数你只填了一个int,那么最后图片的大小就是(int,int),如果你填的是(int,int)一个元组,那么经过该函数的图片的宽高就是(int,int)
再来说scale,如果这个参数你写的是“scale=(0.8, 1.0)”,这意味着这个函数在随机采样这个图片的时候,最少要覆盖这个图片的80%,最多保持图片不变。
接着说ratio,如果这个参数你填的是“ratio=(0.5, 1.0)”,这意味着,随机采样得到的图片,宽高的比例是0.5:1。
总得来说,这个函数会首先根据你设置的scale和ratio对图片进行随机采样,再根据你设置的size对图片进行重构,然后输出。
版权归原作者 qq_43438974 所有, 如有侵权,请联系我们删除。