運算元¶
torchvision.ops 實現專門用於計算機視覺的運算元、損失函式和層。
注意
所有運算元都原生支援 TorchScript。
檢測和分割運算元¶
以下運算元執行目標檢測和分割模型所需的預處理和後處理。
|
以批處理方式執行非最大抑制。 |
|
計算給定掩碼的邊界框。 |
|
根據交併比 (IoU) 對框執行非最大抑制 (NMS)。 |
|
執行感興趣區域 (RoI) 對齊運算元,使用平均池化,如 Mask R-CNN 中所述。 |
|
執行 Fast R-CNN 中所述的感興趣區域 (RoI) 池化運算元。 |
|
執行 Light-Head R-CNN 中提到的位置敏感感興趣區域 (RoI) 對齊運算元。 |
|
執行 R-FCN 中所述的位置敏感感興趣區域 (RoI) 池化運算元。 |
|
在一組特徵圖之上新增 FPN 的模組。 |
|
多尺度 RoIAlign 池化,這對於帶或不帶 FPN 的檢測很有用。 |
|
參見 |
|
參見 |
|
參見 |
|
參見 |
邊界框運算元¶
這些實用函式對邊界框執行各種操作。
|
計算給定格式的邊界框集合的面積。 |
|
將給定 |
|
返回給定格式的兩個邊界框集合之間的交併比 (Jaccard 指數)。 |
|
剪下邊界框,使其位於大小為 |
|
返回兩個邊界框集合之間的完整交併比 (Jaccard 指數)。 |
|
返回兩個邊界框集合之間的距離交併比 (Jaccard 指數)。 |
|
返回兩個邊界框集合之間的廣義交併比 (Jaccard 指數)。 |
|
從 |
損失函式¶
實現了以下計算機視覺特定損失函式。
|
梯度友好的 IoU 損失,在邊界框不重疊時具有非零的附加懲罰。 |
|
梯度友好的 IoU 損失,在邊界框中心距離不為零時具有非零的附加懲罰。 |
|
梯度友好的 IoU 損失,在邊界框不重疊時具有非零的附加懲罰,並且該懲罰隨其最小包圍框的大小而縮放。 |
|
RetinaNet 中用於密集檢測的損失函式:https://arxiv.org/abs/1708.02002。 |
層¶
TorchVision 提供常用的構建塊作為層。
|
用於 Convolution2d-Normalization-Activation 塊的可配置模組。 |
|
用於 Convolution3d-Normalization-Activation 塊的可配置模組。 |
|
參見 |
|
參見 |
|
參見 |
|
BatchNorm2d,其中批次統計量和仿射引數是固定的。 |
|
此模組實現多層感知機 (MLP) 模組。 |
|
此模組返回一個具有置換維度的張量輸入的檢視。 |
|
此模組實現來自 https://arxiv.org/abs/1709.01507 的 Squeeze-and-Excitation 塊(參見圖。 |
|
|
執行可變形卷積 v2,如 Deformable ConvNets v2: More Deformable, Better Results 中所述(如果 |
|
實現來自 "DropBlock: A regularization method for convolutional networks" <https://arxiv.org/abs/1810.12890> 的 DropBlock2d。 |
|
實現來自 "DropBlock: A regularization method for convolutional networks" <https://arxiv.org/abs/1810.12890> 的 DropBlock3d。 |
|
實現來自 "Deep Networks with Stochastic Depth" 的隨機深度,用於隨機丟棄殘差架構的殘差分支。 |