快捷方式

SceneFlowStereo

class torchvision.datasets.SceneFlowStereo(root: Union[str, Path], variant: str = 'FlyingThings3D', pass_name: str = 'clean', transforms: Optional[Callable] = None)[source]

用于 Scene Flow 数据集的 Dataset 接口。此接口提供对 FlyingThings3D、`MonkaaDriving 数据集的访问。

数据集应具有以下结构

root
    SceneFlow
        Monkaa
            frames_cleanpass
                scene1
                    left
                        img1.png
                        img2.png
                    right
                        img1.png
                        img2.png
                scene2
                    left
                        img1.png
                        img2.png
                    right
                        img1.png
                        img2.png
            frames_finalpass
                scene1
                    left
                        img1.png
                        img2.png
                    right
                        img1.png
                        img2.png
                ...
                ...
            disparity
                scene1
                    left
                        img1.pfm
                        img2.pfm
                    right
                        img1.pfm
                        img2.pfm
        FlyingThings3D
            ...
            ...
参数:
  • root (str 或 pathlib.Path) – SceneFlow 所在的根目录。

  • variant (string) – 要使用的数据集变体,“FlyingThings3D”(默认)、“Monkaa”或“Driving”。

  • pass_name (string) – 要使用的通道,“clean”(默认)、“final”或“both”。

  • transforms (callable, optional) – 接受样本并返回转换后版本的函数/转换。

特殊成员:

__getitem__(index: int) Tuple[Image, Image, Optional[ndarray], ndarray][source]

返回给定索引处的示例。

参数:

index (int) – 要检索的示例的索引

返回:

包含 (img_left, img_right, disparity) 的 3 元组。视差是一个形状为 (1, H, W) 的 numpy 数组,图像是 PIL 图像。如果在 transforms 参数中生成了 valid_mask,则返回包含 (img_left, img_right, disparity, valid_mask) 的 4 元组。

返回类型:

tuple

文档

访问 PyTorch 的全面开发者文档

查看文档

教程

获取面向初学者和高级开发者的深入教程

查看教程

资源

查找开发资源并获得问题解答

查看资源