TEDLIUM¶ class torchaudio.datasets.TEDLIUM(root: Union[str, Path], release: str = 'release1', subset: str = 'train', download: bool = False, audio_ext: str = '.sph')[source]¶ Tedlium [Rousseau 等人,2012] 数据集 (版本 1、2 和 3)。 参数: root (str 或 Path) – 数据集所在或下载到的目录的路径。 release (str, 可选) – 版本号。允许的值为 "release1"、"release2" 或 "release3"。 (默认: "release1")。 subset (str, 可选) – 要使用的数据集子集。有效选项为 "train"、"dev" 和 "test"。默认值为 "train"。 download (bool, 可选) – 如果在根路径中找不到数据集,是否下载数据集。 (默认: False)。 audio_ext (str, 可选) – 音频文件的扩展名 (默认: ".sph") 属性¶ phoneme_dict¶ property TEDLIUM.phoneme_dict¶ 音素。从单词到音素元组的映射。注意,一些单词的音素为空。 类型: dict[str, tuple[str]] 方法¶ __getitem__¶ TEDLIUM.__getitem__(n: int) → Tuple[Tensor, int, str, int, int, int][source]¶ 从数据集中加载第 n 个样本。 参数: n (int) – 要加载的样本的索引 返回值: 以下项目的元组; Tensor波形 int采样率 str转录 int对话 ID int说话人 ID int标识符