快捷方式

read_video

torchvision.io.read_video(filename: str, start_pts: Union[float, Fraction] = 0, end_pts: Optional[Union[float, Fraction]] = None, pts_unit: str = 'pts', output_format: str = 'THWC') tuple[torch.Tensor, torch.Tensor, dict[str, Any]][原始碼]

[已棄用] 從檔案中讀取影片,返回影片幀和音訊幀

警告

已棄用:torchvision 的所有影片解碼和編碼功能從 0.22 版本開始已棄用,並將在 0.24 版本中移除。我們建議您遷移到 TorchCodec,我們將在其中整合 PyTorch 未來未來的解碼/編碼功能。

引數:
  • filename (str) – 影片檔案的路徑。如果使用 pyav 後端,則可以是 av.open 接受的任何內容。

  • start_pts (python:int if pts_unit = 'pts', python:float / Fraction if pts_unit = 'sec', optional) – 影片的開始顯示時間

  • end_pts (python:int if pts_unit = 'pts', python:float / Fraction if pts_unit = 'sec', optional) – 結束顯示時間

  • pts_unit (str, optional) – start_pts 和 end_pts 值解釋的單位,可以是 'pts' 或 'sec'。預設為 'pts'。

  • output_format (str, optional) – 輸出影片張量的格式。可以是 "THWC"(預設)或 "TCHW"。

返回:

影片幀 T aframes (Tensor[K, L]): 音訊幀,其中 K 是通道數,L 是點數 info (Dict): 影片和音訊的元資料。可以包含 video_fps (float) 和 audio_fps (int) 欄位。

返回型別:

vframes (Tensor[T, H, W, C] 或 Tensor[T, C, H, W])

使用 read_video 的示例

光流:使用 RAFT 模型預測運動

光流:使用 RAFT 模型預測運動

文件

訪問全面的 PyTorch 開發者文件

檢視文件

教程

為初學者和高階開發者提供深入的教程

檢視教程

資源

查詢開發資源並讓您的問題得到解答

檢視資源