快捷方式

raft_large

torchvision.models.optical_flow.raft_large(#, weights: Optional[Raft_Large_Weights] = None, progress=True, **kwargs) RAFT[原始碼]

RAFT 模型來自 RAFT: Recurrent All Pairs Field Transforms for Optical Flow

請參閱下面的示例,瞭解有關如何使用此模型的教程。

引數:
  • weights (Raft_Large_Weights, optional) – 要使用的預訓練權重。有關更多詳細資訊和可能的值,請參閱下面的 Raft_Large_Weights。預設情況下,不使用預訓練權重。

  • progress (bool) – 如果為 True,則在 stderr 上顯示下載進度條。預設為 True。

  • **kwargs – 傳遞給 torchvision.models.optical_flow.RAFT 基類的引數。有關此類更多詳細資訊,請參閱 原始碼

class torchvision.models.optical_flow.Raft_Large_Weights(value)[原始碼]

上述模型構建器接受以下值作為 weights 引數。 Raft_Large_Weights.DEFAULT 等同於 Raft_Large_Weights.C_T_SKHT_V2。您也可以使用字串,例如 weights='DEFAULT'weights='C_T_V1'

此處報告的指標如下。 epe 是“端點誤差”,表示預測流與其真實值之間的距離(以畫素為單位)。此值對所有影像的所有畫素進行平均。 per_image_epe 類似,但平均方式不同:epe 首先在每張影像上獨立計算,然後對所有影像進行平均。這對應於原始論文中的“Fl-epe”(有時寫為“F1-epe”),並且僅在 Kitti 資料集上使用。 fl-all 也是 Kitti 資料集特有的指標,由該資料集的作者定義,並用於 Kitti 排行榜。它對應於 epe 小於 3 畫素或流的 2-範數小於 5% 的畫素的平均值。

Raft_Large_Weights.C_T_V1:

這些權重是從原始論文移植過來的。它們是在 FlyingChairs + FlyingThings3D 上訓練的。

epe (在 Sintel-Train-Cleanpass 上)

1.4411

epe (在 Sintel-Train-Finalpass 上)

2.7894

per_image_epe (在 Kitti-Train 上)

5.0172

fl_all (在 Kitti-Train 上)

17.4506

min_size

height=128, width=128

引數數量

5257536

方案

連結

GFLOPS

211.01

檔案大小

20.1 MB

推理轉換可在 Raft_Large_Weights.C_T_V1.transforms 處獲得,並執行以下預處理操作:接受 PIL.Image、批處理的 (B, C, H, W) 和單個 (C, H, W) 影像 torch.Tensor 物件。影像被縮放到 [-1.0, 1.0]

Raft_Large_Weights.C_T_V2:

這些權重是從頭開始訓練的。它們在 FlyingChairs + FlyingThings3D 上預訓練。

epe (在 Sintel-Train-Cleanpass 上)

1.3822

epe (在 Sintel-Train-Finalpass 上)

2.7161

per_image_epe (在 Kitti-Train 上)

4.5118

fl_all (在 Kitti-Train 上)

16.0679

min_size

height=128, width=128

引數數量

5257536

方案

連結

GFLOPS

211.01

檔案大小

20.1 MB

推理轉換可在 Raft_Large_Weights.C_T_V2.transforms 處獲得,並執行以下預處理操作:接受 PIL.Image、批處理的 (B, C, H, W) 和單個 (C, H, W) 影像 torch.Tensor 物件。影像被縮放到 [-1.0, 1.0]

Raft_Large_Weights.C_T_SKHT_V1:

這些權重是從原始論文移植過來的。它們在 FlyingChairs + FlyingThings3D 上訓練,並在 Sintel 上進行了微調。Sintel 微調步驟是 SintelKittiFlowHD1KFlyingThings3D(清潔通道)的組合。

epe (在 Sintel-Test-Cleanpass 上)

1.94

epe (在 Sintel-Test-Finalpass 上)

3.18

min_size

height=128, width=128

引數數量

5257536

方案

連結

GFLOPS

211.01

檔案大小

20.1 MB

推理轉換可在 Raft_Large_Weights.C_T_SKHT_V1.transforms 處獲得,並執行以下預處理操作:接受 PIL.Image、批處理的 (B, C, H, W) 和單個 (C, H, W) 影像 torch.Tensor 物件。影像被縮放到 [-1.0, 1.0]

Raft_Large_Weights.C_T_SKHT_V2:

這些權重是從頭開始訓練的。它們在 FlyingChairs + FlyingThings3D 上預訓練,然後在 Sintel 上進行了微調。Sintel 微調步驟是 SintelKittiFlowHD1KFlyingThings3D(清潔通道)的組合。也可用作 Raft_Large_Weights.DEFAULT

epe (在 Sintel-Test-Cleanpass 上)

1.819

epe (在 Sintel-Test-Finalpass 上)

3.067

min_size

height=128, width=128

引數數量

5257536

方案

連結

GFLOPS

211.01

檔案大小

20.1 MB

推理轉換可在 Raft_Large_Weights.C_T_SKHT_V2.transforms 處獲得,並執行以下預處理操作:接受 PIL.Image、批處理的 (B, C, H, W) 和單個 (C, H, W) 影像 torch.Tensor 物件。影像被縮放到 [-1.0, 1.0]

Raft_Large_Weights.C_T_SKHT_K_V1:

這些權重是從原始論文移植過來的。它們在 FlyingChairs + FlyingThings3D 上預訓練,在 Sintel 上進行了微調,然後又在 KittiFlow 上進行了微調。Sintel 微調步驟如上所述。

fl_all (在 Kitti-Test 上)

5.1

min_size

height=128, width=128

引數數量

5257536

方案

連結

GFLOPS

211.01

檔案大小

20.1 MB

推理轉換可在 Raft_Large_Weights.C_T_SKHT_K_V1.transforms 處獲得,並執行以下預處理操作:接受 PIL.Image、批處理的 (B, C, H, W) 和單個 (C, H, W) 影像 torch.Tensor 物件。影像被縮放到 [-1.0, 1.0]

Raft_Large_Weights.C_T_SKHT_K_V2:

這些權重是從頭開始訓練的。它們在 FlyingChairs + FlyingThings3D 上預訓練,在 Sintel 上進行了微調,然後又在 KittiFlow 上進行了微調。Sintel 微調步驟如上所述。

fl_all (在 Kitti-Test 上)

5.19

min_size

height=128, width=128

引數數量

5257536

方案

連結

GFLOPS

211.01

檔案大小

20.1 MB

推理轉換可在 Raft_Large_Weights.C_T_SKHT_K_V2.transforms 處獲得,並執行以下預處理操作:接受 PIL.Image、批處理的 (B, C, H, W) 和單個 (C, H, W) 影像 torch.Tensor 物件。影像被縮放到 [-1.0, 1.0]

使用 raft_large 的示例

光流:使用 RAFT 模型預測運動

光流:使用 RAFT 模型預測運動

文件

訪問全面的 PyTorch 開發者文件

檢視文件

教程

為初學者和高階開發者提供深入的教程

檢視教程

資源

查詢開發資源並讓您的問題得到解答

檢視資源