邊界框¶

class torchvision.tv_tensors.BoundingBoxes(data: Any, *, format: torchvision.tv_tensors._bounding_boxes.BoundingBoxFormat | str, canvas_size: tuple[int, int], clamping_mode: Optional[str] = 'soft', dtype: Optional[dtype] = None, device: Optional[Union[device, str, int]] = None, requires_grad: Optional[bool] = None)[原始碼]¶

torch.Tensor 的子類，用於邊界框，形狀為 [N, K]。

注意

TorchVision 0.23 版本開始支援旋轉邊界框，目前仍處於 BETA 階段。我們預計 API 不會發生變化，但可能存在一些罕見的邊緣情況。如果您發現任何問題，請在我們的錯誤跟蹤器上報告： https://github.com/pytorch/vision/issues?q=is:open+is:issue

其中 N 是邊界框的數量，對於未旋轉的框 K 為 4，對於旋轉的框 K 為 5 或 8。

注意

每個樣本應該只有一個 BoundingBoxes 例項，例如 {"img": img, "bbox": BoundingBoxes(...)}，儘管一個 BoundingBoxes 物件可以包含多個邊界框。

引數:

data – 可以使用 torch.as_tensor() 轉換為張量的資料。
format (BoundingBoxFormat, str) – 邊界框的格式。
canvas_size (python:ints 的二元組) – 相應影像或影片的高度和寬度。
clamping_mode – 在應用可能導致邊界框部分超出影像範圍的變換時使用的裁剪模式。可能的值包括：“soft”、“hard” 或 None。詳細資訊請參閱裁剪模式及其對變換的影響。
dtype (torch.dpython:type, 可選) – 邊界框的期望資料型別。如果省略，則將從 data 推斷。
device (torch.device, 可選) – 邊界框的期望裝置。如果省略且 data 是 torch.Tensor，則將從其裝置獲取。否則，邊界框將在 CPU 上構建。
requires_grad (bool, 可選) – 自動微分是否應記錄邊界框上的操作。如果省略且 data 是 torch.Tensor，則將從其值獲取。否則，預設為 False。

使用 BoundingBoxes 的示例

邊界框¶

文件

教程

資源