write_video¶
- torchvision.io.write_video(filename: str, video_array: Tensor, fps: float, video_codec: str = 'libx264', options: Optional[dict[str, Any]] = None, audio_array: Optional[Tensor] = None, audio_fps: Optional[float] = None, audio_codec: Optional[str] = None, audio_options: Optional[dict[str, Any]] = None) None[原始碼]¶
[已棄用] 將 [T, H, W, C] 格式的 4D 張量寫入影片檔案。
警告
已棄用:torchvision 的所有影片解碼和編碼功能從 0.22 版本開始已棄用,並將在 0.24 版本中移除。我們建議您遷移到 TorchCodec,我們將在其中整合 PyTorch 未來未來的解碼/編碼功能。
此函式依賴於 PyAV(因此最終依賴於 FFmpeg)來編碼影片,您可以透過參考 FFMpeg wiki 中的其他可用選項來獲得更精細的控制。
- 引數:
filename (str) – 要儲存影片的路徑
video_array (Tensor[T, H, W, C]) – 包含單個幀的張量,格式為 [T, H, W, C] 的 uint8 張量
fps (Number) – 影片每秒幀數
video_codec (str) – 影片編解碼器的名稱,例如“libx264”、“h264”等。
options (Dict) –
包含要傳遞給 PyAV 影片流的選項的字典。選項列表取決於編解碼器,所有選項均可在 FFMpeg wiki 中找到。
audio_array (Tensor[C, N]) – 包含音訊的張量,其中 C 是聲道數,N 是取樣數
audio_fps (Number) – 音訊取樣率,通常為 44100 或 48000
audio_codec (str) – 音訊編解碼器的名稱,例如“mp3”、“aac”等。
audio_options (Dict) –
包含要傳遞給 PyAV 音訊流的選項的字典。選項列表取決於編解碼器,所有選項均可在 FFMpeg wiki 中找到。
- 示例:
>>> # Creating libx264 video with CRF 17, for visually lossless footage: >>> >>> from torchvision.io import write_video >>> # 1000 frames of 100x100, 3-channel image. >>> vid = torch.randn(1000, 100, 100, 3, dtype = torch.uint8) >>> write_video("video.mp4", options = {"crf": "17"})