快捷方式

邊界框

class torchvision.tv_tensors.BoundingBoxes(data: Any, *, format: torchvision.tv_tensors._bounding_boxes.BoundingBoxFormat | str, canvas_size: tuple[int, int], clamping_mode: Optional[str] = 'soft', dtype: Optional[dtype] = None, device: Optional[Union[device, str, int]] = None, requires_grad: Optional[bool] = None)[原始碼]

torch.Tensor 的子類,用於邊界框,形狀為 [N, K]

注意

TorchVision 0.23 版本開始支援旋轉邊界框,目前仍處於 BETA 階段。我們預計 API 不會發生變化,但可能存在一些罕見的邊緣情況。如果您發現任何問題,請在我們的錯誤跟蹤器上報告: https://github.com/pytorch/vision/issues?q=is:open+is:issue

其中 N 是邊界框的數量,對於未旋轉的框 K 為 4,對於旋轉的框 K 為 5 或 8。

注意

每個樣本應該只有一個 BoundingBoxes 例項,例如 {"img": img, "bbox": BoundingBoxes(...)},儘管一個 BoundingBoxes 物件可以包含多個邊界框。

引數:
  • data – 可以使用 torch.as_tensor() 轉換為張量的資料。

  • format (BoundingBoxFormat, str) – 邊界框的格式。

  • canvas_size (python:ints 的二元組) – 相應影像或影片的高度和寬度。

  • clamping_mode – 在應用可能導致邊界框部分超出影像範圍的變換時使用的裁剪模式。可能的值包括:“soft”、“hard” 或 None。詳細資訊請參閱 裁剪模式及其對變換的影響

  • dtype (torch.dpython:type, 可選) – 邊界框的期望資料型別。如果省略,則將從 data 推斷。

  • device (torch.device, 可選) – 邊界框的期望裝置。如果省略且 datatorch.Tensor,則將從其裝置獲取。否則,邊界框將在 CPU 上構建。

  • requires_grad (bool, 可選) – 自動微分是否應記錄邊界框上的操作。如果省略且 datatorch.Tensor,則將從其值獲取。否則,預設為 False

使用 BoundingBoxes 的示例

如何編寫自己的 v2 變換

如何編寫自己的 v2 變換

如何編寫自己的 TVTensor 類

如何編寫自己的 TVTensor 類

旋轉邊界框上的變換

旋轉邊界框上的變換

變換 v2 入門

變換 v2 入門

TVTensor FAQ

TVTensor FAQ

文件

訪問全面的 PyTorch 開發者文件

檢視文件

教程

為初學者和高階開發者提供深入的教程

檢視教程

資源

查詢開發資源並讓您的問題得到解答

檢視資源