FiveCrop¶
- class torchvision.transforms.v2.FiveCrop(size: Union[int, Sequence[int]])[原始碼]¶
將影像或影片裁剪成四個角和中心裁剪。
如果輸入是
torch.Tensor、Image或Video,它可以具有任意數量的前導批次維度。例如,影像的形狀可以是[..., C, H, W]。注意
此變換返回一個影像元組,並且您的 Dataset 返回的輸入和目標數量可能不匹配。有關如何處理此問題,請參閱下面的示例。
- 引數:
size (sequence 或 int) – 裁剪的所需輸出大小。如果 size 是
int而不是序列 (h, w),則進行大小為 (size, size) 的方形裁剪。如果提供長度為 1 的序列,它將被解釋為 (size[0], size[0])。
示例
>>> class BatchMultiCrop(transforms.Transform): ... def forward(self, sample: Tuple[Tuple[Union[tv_tensors.Image, tv_tensors.Video], ...], int]): ... images_or_videos, labels = sample ... batch_size = len(images_or_videos) ... image_or_video = images_or_videos[0] ... images_or_videos = tv_tensors.wrap(torch.stack(images_or_videos), like=image_or_video) ... labels = torch.full((batch_size,), label, device=images_or_videos.device) ... return images_or_videos, labels ... >>> image = tv_tensors.Image(torch.rand(3, 256, 256)) >>> label = 3 >>> transform = transforms.Compose([transforms.FiveCrop(224), BatchMultiCrop()]) >>> images, labels = transform(image, label) >>> images.shape torch.Size([5, 3, 224, 224]) >>> labels tensor([3, 3, 3, 3, 3])
FiveCrop的示例