Kitti¶
- class torchvision.datasets.Kitti(root: Union[str, Path], train: bool = True, transform: Optional[Callable] = None, target_transform: Optional[Callable] = None, transforms: Optional[Callable] = None, download: bool = False)[source]¶
KITTI 数据集。
它对应于用于对象检测的“对象左侧彩色图像”数据集。
- 参数:
root (str 或
pathlib.Path
) –下载图像的根目录。如果 download=False,则需要以下文件夹结构
<root> └── Kitti └─ raw ├── training | ├── image_2 | └── label_2 └── testing └── image_2
train (bool, 可选) – 如果为 true,则使用
train
拆分,否则使用test
拆分。默认为train
。transform (callable, 可选) – 接收 PIL 图像并返回转换版本的函数/转换。例如,
transforms.PILToTensor
target_transform (callable, 可选) – 接收目标并对其进行转换的函数/转换。
transforms (callable, 可选) – 接收输入样本及其目标作为条目并返回转换版本的函数/转换。
download (bool, 可选) – 如果为 true,则从互联网下载数据集并将其放入根目录。如果数据集已下载,则不会再次下载。
- 特殊成员:
- __getitem__(index: int) Tuple[Any, Any] [source]¶
获取给定索引处的项目。
- 参数:
index (int) – 索引
- 返回:
(image, target),其中 target 是包含以下键的字典列表
type: str (类型:字符串)
truncated: float (截断:浮点数)
occluded: int (遮挡:整数)
alpha: float (Alpha:浮点数)
bbox: float[4] (bbox:浮点数[4])
dimensions: float[3] (尺寸:浮点数[3])
locations: float[3] (位置:浮点数[3])
rotation_y: float (rotation_y:浮点数)
- 返回类型: