LibriLightLimited¶ class torchaudio.datasets.LibriLightLimited(root: Union[str, Path], subset: str = '10min', download: bool = False)[source]¶ Libri-light [Kahn 等, 2020] 数据集的子集,在 HuBERT [Hsu 等, 2021] 中用于监督微调。 参数: root (str 或 Path) – 数据集所在或下载到的目录路径。 subset (str, 可选) – 要使用的子集。选项:["10min", "1h", "10h"] (默认: "10min")。 download (bool, 可选) – 如果数据集未在 root 路径找到,是否下载。 (默认: False)。 __getitem__¶ LibriLightLimited.__getitem__(n: int) → Tuple[Tensor, int, str, int, int, int][source]¶ 从数据集中加载第 n 个样本。 参数: n (int) – 要加载样本的索引 返回: 包含以下元素的元组; Tensor波形 int采样率 str转录文本 int说话人 ID int章节 ID int话语 ID