raft_large¶
- torchvision.models.optical_flow.raft_large(#, weights: Optional[Raft_Large_Weights] = None, progress=True, **kwargs) RAFT[原始碼]¶
RAFT 模型來自 RAFT: Recurrent All Pairs Field Transforms for Optical Flow。
請參閱下面的示例,瞭解有關如何使用此模型的教程。
- 引數:
weights (
Raft_Large_Weights, optional) – 要使用的預訓練權重。有關更多詳細資訊和可能的值,請參閱下面的Raft_Large_Weights。預設情況下,不使用預訓練權重。progress (bool) – 如果為 True,則在 stderr 上顯示下載進度條。預設為 True。
**kwargs – 傳遞給
torchvision.models.optical_flow.RAFT基類的引數。有關此類更多詳細資訊,請參閱 原始碼。
- class torchvision.models.optical_flow.Raft_Large_Weights(value)[原始碼]¶
上述模型構建器接受以下值作為
weights引數。Raft_Large_Weights.DEFAULT等同於Raft_Large_Weights.C_T_SKHT_V2。您也可以使用字串,例如weights='DEFAULT'或weights='C_T_V1'。此處報告的指標如下。
epe是“端點誤差”,表示預測流與其真實值之間的距離(以畫素為單位)。此值對所有影像的所有畫素進行平均。per_image_epe類似,但平均方式不同:epe 首先在每張影像上獨立計算,然後對所有影像進行平均。這對應於原始論文中的“Fl-epe”(有時寫為“F1-epe”),並且僅在 Kitti 資料集上使用。fl-all也是 Kitti 資料集特有的指標,由該資料集的作者定義,並用於 Kitti 排行榜。它對應於 epe 小於 3 畫素或流的 2-範數小於 5% 的畫素的平均值。Raft_Large_Weights.C_T_V1:
這些權重是從原始論文移植過來的。它們是在
FlyingChairs+FlyingThings3D上訓練的。epe (在 Sintel-Train-Cleanpass 上)
1.4411
epe (在 Sintel-Train-Finalpass 上)
2.7894
per_image_epe (在 Kitti-Train 上)
5.0172
fl_all (在 Kitti-Train 上)
17.4506
min_size
height=128, width=128
引數數量
5257536
方案
GFLOPS
211.01
檔案大小
20.1 MB
推理轉換可在
Raft_Large_Weights.C_T_V1.transforms處獲得,並執行以下預處理操作:接受PIL.Image、批處理的(B, C, H, W)和單個(C, H, W)影像torch.Tensor物件。影像被縮放到[-1.0, 1.0]。Raft_Large_Weights.C_T_V2:
這些權重是從頭開始訓練的。它們在
FlyingChairs+FlyingThings3D上預訓練。epe (在 Sintel-Train-Cleanpass 上)
1.3822
epe (在 Sintel-Train-Finalpass 上)
2.7161
per_image_epe (在 Kitti-Train 上)
4.5118
fl_all (在 Kitti-Train 上)
16.0679
min_size
height=128, width=128
引數數量
5257536
方案
GFLOPS
211.01
檔案大小
20.1 MB
推理轉換可在
Raft_Large_Weights.C_T_V2.transforms處獲得,並執行以下預處理操作:接受PIL.Image、批處理的(B, C, H, W)和單個(C, H, W)影像torch.Tensor物件。影像被縮放到[-1.0, 1.0]。Raft_Large_Weights.C_T_SKHT_V1:
這些權重是從原始論文移植過來的。它們在
FlyingChairs+FlyingThings3D上訓練,並在 Sintel 上進行了微調。Sintel 微調步驟是Sintel、KittiFlow、HD1K和FlyingThings3D(清潔通道)的組合。epe (在 Sintel-Test-Cleanpass 上)
1.94
epe (在 Sintel-Test-Finalpass 上)
3.18
min_size
height=128, width=128
引數數量
5257536
方案
GFLOPS
211.01
檔案大小
20.1 MB
推理轉換可在
Raft_Large_Weights.C_T_SKHT_V1.transforms處獲得,並執行以下預處理操作:接受PIL.Image、批處理的(B, C, H, W)和單個(C, H, W)影像torch.Tensor物件。影像被縮放到[-1.0, 1.0]。Raft_Large_Weights.C_T_SKHT_V2:
這些權重是從頭開始訓練的。它們在
FlyingChairs+FlyingThings3D上預訓練,然後在 Sintel 上進行了微調。Sintel 微調步驟是Sintel、KittiFlow、HD1K和FlyingThings3D(清潔通道)的組合。也可用作Raft_Large_Weights.DEFAULT。epe (在 Sintel-Test-Cleanpass 上)
1.819
epe (在 Sintel-Test-Finalpass 上)
3.067
min_size
height=128, width=128
引數數量
5257536
方案
GFLOPS
211.01
檔案大小
20.1 MB
推理轉換可在
Raft_Large_Weights.C_T_SKHT_V2.transforms處獲得,並執行以下預處理操作:接受PIL.Image、批處理的(B, C, H, W)和單個(C, H, W)影像torch.Tensor物件。影像被縮放到[-1.0, 1.0]。Raft_Large_Weights.C_T_SKHT_K_V1:
這些權重是從原始論文移植過來的。它們在
FlyingChairs+FlyingThings3D上預訓練,在 Sintel 上進行了微調,然後又在KittiFlow上進行了微調。Sintel 微調步驟如上所述。fl_all (在 Kitti-Test 上)
5.1
min_size
height=128, width=128
引數數量
5257536
方案
GFLOPS
211.01
檔案大小
20.1 MB
推理轉換可在
Raft_Large_Weights.C_T_SKHT_K_V1.transforms處獲得,並執行以下預處理操作:接受PIL.Image、批處理的(B, C, H, W)和單個(C, H, W)影像torch.Tensor物件。影像被縮放到[-1.0, 1.0]。Raft_Large_Weights.C_T_SKHT_K_V2:
這些權重是從頭開始訓練的。它們在
FlyingChairs+FlyingThings3D上預訓練,在 Sintel 上進行了微調,然後又在KittiFlow上進行了微調。Sintel 微調步驟如上所述。fl_all (在 Kitti-Test 上)
5.19
min_size
height=128, width=128
引數數量
5257536
方案
GFLOPS
211.01
檔案大小
20.1 MB
推理轉換可在
Raft_Large_Weights.C_T_SKHT_K_V2.transforms處獲得,並執行以下預處理操作:接受PIL.Image、批處理的(B, C, H, W)和單個(C, H, W)影像torch.Tensor物件。影像被縮放到[-1.0, 1.0]。
使用
raft_large的示例