快捷方式

Middlebury2014Stereo

class torchvision.datasets.Middlebury2014Stereo(root: Union[str, Path], split: str = 'train', calibration: Optional[str] = 'perfect', use_ambient_views: bool = False, transforms: Optional[Callable] = None, download: bool = False)[原始碼]

公共可用的 Middlebury 資料集 2014 版本 <https://vision.middlebury.edu/stereo/data/scenes2014/> 中的場景。

該資料集主要遵循原始格式,不包含 ambient 子目錄。

root
    Middlebury2014
        train
            scene1-{perfect,imperfect}
                calib.txt
                im{0,1}.png
                im1E.png
                im1L.png
                disp{0,1}.pfm
                disp{0,1}-n.png
                disp{0,1}-sd.pfm
                disp{0,1}y.pfm
            scene2-{perfect,imperfect}
                calib.txt
                im{0,1}.png
                im1E.png
                im1L.png
                disp{0,1}.pfm
                disp{0,1}-n.png
                disp{0,1}-sd.pfm
                disp{0,1}y.pfm
            ...
        additional
            scene1-{perfect,imperfect}
                calib.txt
                im{0,1}.png
                im1E.png
                im1L.png
                disp{0,1}.pfm
                disp{0,1}-n.png
                disp{0,1}-sd.pfm
                disp{0,1}y.pfm
            ...
        test
            scene1
                calib.txt
                im{0,1}.png
            scene2
                calib.txt
                im{0,1}.png
            ...
引數:
  • root (str 或 pathlib.Path) – Middleburry 2014 資料集的根目錄。

  • split (字串, 可選) – 場景的資料集劃分,可以是“train”(預設)、“test”或“additional”。

  • use_ambient_views (布林值, 可選) – 是否在可能的情況下使用不同的曝光或閃光檢視。資料集以相等的機率在 [im1.png, im1E.png, im1L.png] 之間進行取樣。

  • calibration (字串, 可選) – 是否使用校準(預設)或未校準的場景。

  • transforms (callable, optional) – 一個函式/變換,接收一個樣本並返回一個變換後的版本。

  • download (布林值, 可選) – 是否在 root 目錄中下載資料集。

特殊成員:

__getitem__(index: int) tuple[PIL.Image.Image, PIL.Image.Image, Optional[numpy.ndarray]][原始碼]

在給定索引處返回示例。

引數:

index (int) – 要檢索的示例的索引

返回:

一個 4 元組,包含 (img_left, img_right, disparity, valid_mask)。視差是一個形狀為 (1, H, W) 的 numpy 陣列,影像是 PIL 影像。對於 split=testvalid_mask 隱式為 None

返回型別:

元組

文件

訪問全面的 PyTorch 開發者文件

檢視文件

教程

為初學者和高階開發者提供深入的教程

檢視教程

資源

查詢開發資源並讓您的問題得到解答

檢視資源