快捷方式

sanitize_bounding_boxes

torchvision.transforms.v2.functional.sanitize_bounding_boxes(bounding_boxes: Tensor, format: Optional[BoundingBoxFormat] = None, canvas_size: Optional[tuple[int, int]] = None, min_size: float = 1.0, min_area: float = 1.0) tuple[torch.Tensor, torch.Tensor][原始碼]

移除退化/無效的邊界框,並返回相應的索引掩碼。

這會移除以下邊界框:

  • 小於給定 min_sizemin_area 的邊界框:預設情況下,這也會移除退化的邊界框,例如 X2 <= X1。

  • 其任何座標超出相應影像範圍的邊界框。您可能需要先呼叫 clamp_bounding_boxes() 以避免不必要的移除。

建議在管道結束時呼叫此函式,然後再將輸入傳遞給模型。如果呼叫了 RandomIoUCrop,則必須呼叫此變換。如果您想更加小心,可以在所有可能修改邊界框的變換之後呼叫它,但在大多數情況下,最後呼叫一次應該就足夠了。

引數:
  • bounding_boxes (Tensor 或 BoundingBoxes) – 要淨化的邊界框。

  • format (str 或 BoundingBoxFormat, optional) – 邊界框的格式。如果 bounding_boxesBoundingBoxes 物件,則必須將其保留為 None。

  • canvas_size (tuple of python:int, optional) – 邊界框的 canvas_size(相應影像/影片的大小)。如果 bounding_boxesBoundingBoxes 物件,則必須將其保留為 None。

  • min_size (float, optional) –

  • min_area (float, optional) –

返回:

有效邊界框的子集,以及相應的索引掩碼。然後可以使用該掩碼來子集化與邊界框關聯的其他張量(例如,標籤)。

返回型別:

out (tuple of Tensors)

文件

訪問全面的 PyTorch 開發者文件

檢視文件

教程

為初學者和高階開發者提供深入的教程

檢視教程

資源

查詢開發資源並讓您的問題得到解答

檢視資源