AudioDecoder¶

class torchcodec.decoders.AudioDecoder(source: Union[str, Path, RawIOBase, BufferedReader, bytes, Tensor], *, stream_index: Optional[int] = None, sample_rate: Optional[int] = None, num_channels: Optional[int] = None)[原始碼]¶

一個單流音訊解碼器。

這可用於解碼純音訊檔案（例如 mp3、wav 等）或包含音訊流的影片（例如 mp4 影片）中的音訊。

返回的樣本是歸一化在 [-1, 1] 範圍內的浮點樣本

引數:

(str (source) –
object): 影片或音訊的來源
- 如果為 str：本地路徑或影片/音訊檔案的 URL。
- 如果為 Pathlib.path：本地影片或音訊檔案的路徑。
- 如果為 bytes 物件或 torch.Tensor：原始編碼的音訊資料。
- 如果是類檔案物件：我們將按需從該物件讀取影片資料。該物件必須公開 read(self, size: int) -> bytes 和 seek(self, offset: int, whence: int) -> bytes 方法。詳細閱讀：透過類檔案支援流式傳輸資料。
Pathlib.path –
object): 影片或音訊的來源
- 如果為 str：本地路徑或影片/音訊檔案的 URL。
- 如果為 Pathlib.path：本地影片或音訊檔案的路徑。
- 如果為 bytes 物件或 torch.Tensor：原始編碼的音訊資料。
- 如果是類檔案物件：我們將按需從該物件讀取影片資料。該物件必須公開 read(self, size: int) -> bytes 和 seek(self, offset: int, whence: int) -> bytes 方法。詳細閱讀：透過類檔案支援流式傳輸資料。
bytes –
object): 影片或音訊的來源
- 如果為 str：本地路徑或影片/音訊檔案的 URL。
- 如果為 Pathlib.path：本地影片或音訊檔案的路徑。
- 如果為 bytes 物件或 torch.Tensor：原始編碼的音訊資料。
- 如果是類檔案物件：我們將按需從該物件讀取影片資料。該物件必須公開 read(self, size: int) -> bytes 和 seek(self, offset: int, whence: int) -> bytes 方法。詳細閱讀：透過類檔案支援流式傳輸資料。
file-like (torch.Tensor 或) –
object): 影片或音訊的來源
- 如果為 str：本地路徑或影片/音訊檔案的 URL。
- 如果為 Pathlib.path：本地影片或音訊檔案的路徑。
- 如果為 bytes 物件或 torch.Tensor：原始編碼的音訊資料。
- 如果是類檔案物件：我們將按需從該物件讀取影片資料。該物件必須公開 read(self, size: int) -> bytes 和 seek(self, offset: int, whence: int) -> bytes 方法。詳細閱讀：透過類檔案支援流式傳輸資料。
stream_index (int, optional) – 指定要從中解碼樣本的檔案的流。請注意，此索引對於所有媒體型別都是絕對的。如果未指定，則使用最佳流。
sample_rate (int, optional) – 解碼樣本所需的輸出取樣率。預設情況下，使用源的取樣率。
num_channels (int, optional) – 解碼樣本所需的通道數。預設情況下，使用源的通道數。

變數: