TEDLIUM¶

class torchaudio.datasets.TEDLIUM(root: Union[str, Path], release: str = 'release1', subset: str = 'train', download: bool = False, audio_ext: str = '.sph')[source]¶

Tedlium [Rousseau et al., 2012] 数据集 (版本 1,2 和 3)。

参数：

root (str or Path) – 数据集所在或下载到的目录路径。
release (str, optional) – 版本号。允许的值为 "release1", "release2" 或 "release3"。（默认值："release1"）。
subset (str, optional) – 要使用的数据集子集。有效选项为 "train", "dev", 和 "test"。默认为 "train"。
download (bool, optional) – 如果在根路径下找不到数据集是否下载。（默认值：False）。
audio_ext (str, optional) – 音频文件扩展名（默认值：".sph"）

属性¶

phoneme_dict¶

property TEDLIUM.phoneme_dict¶

音素。单词到音素元组的映射。请注意，有些单词没有音素。

类型：: dict[str, tuple[str]]

方法¶

getitem¶

TEDLIUM.__getitem__(n: int) → Tuple[Tensor, int, str, int, int, int][source]¶

从数据集中加载第 n 个样本。

参数：

n (int) – 要加载的样本索引

返回：

以下项目的元组；

Tensor: 波形
int: 采样率
str: 文字记录
int: 讲话 ID
int: 说话者 ID
int: 标识符

TEDLIUM¶

属性¶

phoneme_dict¶

方法¶

getitem¶

文档

教程

资源

TEDLIUM¶

属性¶

phoneme_dict¶

方法¶

__getitem__¶

文档

教程

资源

getitem¶