decode_png¶
- torchvision.io.decode_png(input: Tensor, mode: ImageReadMode = ImageReadMode.UNCHANGED, apply_exif_orientation: bool = False) Tensor[原始碼]¶
將 PNG 影像解碼為 3 維的 RGB 或灰度張量。
在大多數情況下,輸出張量的值為 uint8,範圍在 [0, 255] 之間。如果影像是 16 位 PNG,則輸出張量為 uint16,範圍在 [0, 65535] 之間(從 torchvision
0.21開始支援)。由於 PyTorch 對 uint16 的支援有限,因此我們建議在此函式後呼叫torchvision.transforms.v2.functional.to_dtype()並設定scale=True,將解碼後的影像轉換為 uint8 或 float 張量。- 引數:
input (Tensor[1]) – 包含 PNG 影像原始位元組的一維 uint8 張量。
mode (str 或 ImageReadMode) – 要轉換到的影像模式,例如“RGB”。預設為“UNCHANGED”。有關可用模式,請參見
ImageReadMode。apply_exif_orientation (bool) – 將 EXIF 方向變換應用於輸出張量。預設為 False。
- 返回:
output (Tensor[image_channels, image_height, image_width])