Kitti¶

class torchvision.datasets.Kitti(root: Union[str, Path], train: bool = True, transform: Optional[Callable] = None, target_transform: Optional[Callable] = None, transforms: Optional[Callable] = None, download: bool = False)[源代码]¶

KITTI 数据集。

它对应于“物体左侧彩色图像”数据集，用于物体检测。

参数：

root (str 或 pathlib.Path) –

图片下载到的根目录。如果 download=False，则需要以下文件夹结构

<root>
    └── Kitti
        └─ raw
            ├── training
            |   ├── image_2
            |   └── label_2
            └── testing
                └── image_2

train (bool, 可选) – 如果为 true，则使用 train 分割集，否则使用 test 分割集。默认为 train。
transform (callable, 可选) – 一个函数/转换，接受 PIL 图像并返回转换后的版本。例如，transforms.PILToTensor
target_transform (callable, 可选) – 一个函数/转换，接受目标并对其进行转换。
transforms (callable, 可选) – 一个函数/转换，接受输入样本及其目标作为输入，并返回转换后的版本。
download (bool, 可选) – 如果为 true，则从互联网下载数据集并将其放在根目录中。如果数据集已下载，则不会再次下载。

特殊成员：

__getitem__(index: int) → Tuple[Any, Any][源代码]¶

获取给定索引处的项。

参数：

index (int) – 索引

返回：

(image, target)，其中 target 是一个字典列表，包含以下键：

type: str
truncated: float
occluded: int
alpha: float
bbox: float[4]
dimensions: float[3]
locations: float[3]
rotation_y: float

返回类型：

tuple

Kitti¶

文档

教程

资源