邊界框¶
- class torchvision.tv_tensors.BoundingBoxes(data: Any, *, format: torchvision.tv_tensors._bounding_boxes.BoundingBoxFormat | str, canvas_size: tuple[int, int], clamping_mode: Optional[str] = 'soft', dtype: Optional[dtype] = None, device: Optional[Union[device, str, int]] = None, requires_grad: Optional[bool] = None)[原始碼]¶
torch.Tensor的子類,用於邊界框,形狀為[N, K]。注意
TorchVision 0.23 版本開始支援旋轉邊界框,目前仍處於 BETA 階段。我們預計 API 不會發生變化,但可能存在一些罕見的邊緣情況。如果您發現任何問題,請在我們的錯誤跟蹤器上報告: https://github.com/pytorch/vision/issues?q=is:open+is:issue
其中
N是邊界框的數量,對於未旋轉的框K為 4,對於旋轉的框K為 5 或 8。注意
每個樣本應該只有一個
BoundingBoxes例項,例如{"img": img, "bbox": BoundingBoxes(...)},儘管一個BoundingBoxes物件可以包含多個邊界框。- 引數:
data – 可以使用
torch.as_tensor()轉換為張量的資料。format (BoundingBoxFormat, str) – 邊界框的格式。
canvas_size (python:ints 的二元組) – 相應影像或影片的高度和寬度。
clamping_mode – 在應用可能導致邊界框部分超出影像範圍的變換時使用的裁剪模式。可能的值包括:“soft”、“hard” 或
None。詳細資訊請參閱 裁剪模式及其對變換的影響。dtype (torch.dpython:type, 可選) – 邊界框的期望資料型別。如果省略,則將從
data推斷。device (torch.device, 可選) – 邊界框的期望裝置。如果省略且
data是torch.Tensor,則將從其裝置獲取。否則,邊界框將在 CPU 上構建。requires_grad (bool, 可選) – 自動微分是否應記錄邊界框上的操作。如果省略且
data是torch.Tensor,則將從其值獲取。否則,預設為False。
使用
BoundingBoxes的示例