快捷键

SceneFlowStereo

class torchvision.datasets.SceneFlowStereo(root: Union[str, Path], variant: str = 'FlyingThings3D', pass_name: str = 'clean', transforms: Optional[Callable] = None)[源代码]

用于 Scene Flow 数据集的数据集接口。此接口提供对 FlyingThings3D、`MonkaaDriving 数据集的访问。

数据集预计具有以下结构

root
    SceneFlow
        Monkaa
            frames_cleanpass
                scene1
                    left
                        img1.png
                        img2.png
                    right
                        img1.png
                        img2.png
                scene2
                    left
                        img1.png
                        img2.png
                    right
                        img1.png
                        img2.png
            frames_finalpass
                scene1
                    left
                        img1.png
                        img2.png
                    right
                        img1.png
                        img2.png
                ...
                ...
            disparity
                scene1
                    left
                        img1.pfm
                        img2.pfm
                    right
                        img1.pfm
                        img2.pfm
        FlyingThings3D
            ...
            ...
参数:
  • root (str 或 pathlib.Path) – SceneFlow 所在的根目录。

  • variant (string) – 要使用的哪个数据集变体,“FlyingThings3D”(默认)、“Monkaa” 或“Driving”。

  • pass_name (string) – 要使用的哪个通道, “clean”(默认)、“final” 或“both”。

  • transforms (callable, optional) – 一个函数/变换,它接受一个样本并返回一个变换后的版本。

特殊成员:

__getitem__(index: int) Tuple[Image, Image, Optional[ndarray], ndarray][源代码]

返回给定索引处的示例。

参数:

index (int) – 要检索的示例的索引

返回:

一个包含 (img_left, img_right, disparity) 的 3 元组。视差是一个形状为 (1, H, W) 的 numpy 数组,图像为 PIL 图像。如果在 transforms 参数中生成了 valid_mask,则返回一个包含 (img_left, img_right, disparity, valid_mask) 的 4 元组。

返回类型:

元组

文档

访问 PyTorch 的综合开发者文档

查看文档

教程

获取针对初学者和高级开发人员的深入教程

查看教程

资源

查找开发资源并获得问题的解答

查看资源