影片 MViT¶

模型構建器¶

可以使用以下模型構建器來例項化 MViT v1 或 v2 模型，可選擇是否包含預訓練權重。所有模型構建器都內部依賴於 torchvision.models.video.MViT 基類。有關此類的更多詳細資訊，請參閱原始碼。

`mvit_v1_b`(*[, weights, progress])	從 Multiscale Vision Transformers 構建基礎 MViTV1 架構。
`mvit_v2_s`(*[, weights, progress])	從 Multiscale Vision Transformers 和 MViTv2: Improved Multiscale Vision Transformers for Classification and Detection 構建小型 MViTV2 架構。