RandomResize¶

class torchvision.transforms.v2.RandomResize(min_size: int, max_size: int, interpolation: Union[InterpolationMode, int] = InterpolationMode.BILINEAR, antialias: Optional[bool] = True)[源]¶

隨機調整輸入大小。

此變換可以與 RandomCrop 一起用作資料增強，以訓練影像分割模型的模型。

輸出的空間尺寸是隨機從 [min_size, max_size] 區間中取樣的

size = uniform_sample(min_size, max_size)
output_width = size
output_height = size

如果輸入是 torch.Tensor 或 TVTensor (例如 Image, Video, BoundingBoxes 等) ，它可以具有任意數量的前導批次維度。例如，影像可以具有 [..., C, H, W] 形狀。邊界框可以具有 [..., 4] 形狀。

引數:

min_size (int) – 隨機取樣的最小輸出尺寸
max_size (int) – 隨機取樣的最大輸出尺寸
interpolation (InterpolationMode, optional) – 由 torchvision.transforms.InterpolationMode 定義的期望的插值列舉。預設為 InterpolationMode.BILINEAR。如果輸入是 Tensor，則僅支援 InterpolationMode.NEAREST、InterpolationMode.NEAREST_EXACT、InterpolationMode.BILINEAR 和 InterpolationMode.BICUBIC。也接受相應的 Pillow 整數常量，例如 PIL.Image.BILINEAR。
antialias (bool, optional) –
是否應用抗鋸齒。它僅影響雙線性或雙三次模式下的張量，否則將被忽略：在 PIL 影像上，雙線性或雙三次模式始終應用抗鋸齒；在其他模式下（對於 PIL 影像和張量），抗鋸齒沒有意義，此引數將被忽略。可能的值為
- True (預設)：將對雙線性或雙三次模式應用抗鋸齒。其他模式不受影響。這可能是您想要使用的。
- False：將不對任何模式下的張量應用抗鋸齒。PIL 影像在雙線性或雙三次模式下仍然進行抗鋸齒處理，因為 PIL 不支援無抗鋸齒。
- None：對於張量相當於 False，對於 PIL 影像相當於 True。此值存在是為了相容性，除非您真的知道自己在做什麼，否則可能不希望使用它。
預設值在 v0.17 中從 None 更改為 True，以使 PIL 和 Tensor 後端保持一致。

make_params(flat_inputs: list[Any]) → dict[str, Any][源]¶

用於覆蓋自定義變換的方法。

請參閱如何編寫自己的 v2 變換

transform(inpt: Any, params: dict[str, Any]) → Any[源]¶

用於覆蓋自定義變換的方法。

請參閱如何編寫自己的 v2 變換

RandomResize¶

文件

教程

資源