RandomResize¶
- class torchvision.transforms.v2.RandomResize(min_size: int, max_size: int, interpolation: Union[InterpolationMode, int] = InterpolationMode.BILINEAR, antialias: Optional[bool] = True)[源]¶
隨機調整輸入大小。
此變換可以與
RandomCrop一起用作資料增強,以訓練影像分割模型的模型。輸出的空間尺寸是隨機從
[min_size, max_size]區間中取樣的size = uniform_sample(min_size, max_size) output_width = size output_height = size
如果輸入是
torch.Tensor或TVTensor(例如Image,Video,BoundingBoxes等) ,它可以具有任意數量的前導批次維度。例如,影像可以具有[..., C, H, W]形狀。邊界框可以具有[..., 4]形狀。- 引數:
min_size (int) – 隨機取樣的最小輸出尺寸
max_size (int) – 隨機取樣的最大輸出尺寸
interpolation (InterpolationMode, optional) – 由
torchvision.transforms.InterpolationMode定義的期望的插值列舉。預設為InterpolationMode.BILINEAR。如果輸入是 Tensor,則僅支援InterpolationMode.NEAREST、InterpolationMode.NEAREST_EXACT、InterpolationMode.BILINEAR和InterpolationMode.BICUBIC。也接受相應的 Pillow 整數常量,例如PIL.Image.BILINEAR。antialias (bool, optional) –
是否應用抗鋸齒。它僅影響雙線性或雙三次模式下的張量,否則將被忽略:在 PIL 影像上,雙線性或雙三次模式始終應用抗鋸齒;在其他模式下(對於 PIL 影像和張量),抗鋸齒沒有意義,此引數將被忽略。可能的值為
True(預設):將對雙線性或雙三次模式應用抗鋸齒。其他模式不受影響。這可能是您想要使用的。False:將不對任何模式下的張量應用抗鋸齒。PIL 影像在雙線性或雙三次模式下仍然進行抗鋸齒處理,因為 PIL 不支援無抗鋸齒。None:對於張量相當於False,對於 PIL 影像相當於True。此值存在是為了相容性,除非您真的知道自己在做什麼,否則可能不希望使用它。
預設值在 v0.17 中從
None更改為True,以使 PIL 和 Tensor 後端保持一致。