快捷方式

VCTK_092

class torchaudio.datasets.VCTK_092(root: str, mic_id: str = 'mic2', download: bool = False, url: str = 'https://datashare.is.ed.ac.uk/bitstream/handle/10283/3443/VCTK-Corpus-0.92.zip', audio_ext='.flac')[source]

VCTK 0.92 [Yamagishi et al., 2019] 数据集

参数:
  • root (str) – 数据集顶级目录所在的根目录。

  • mic_id (str, 可选) – 麦克风 ID。可以是 "mic1""mic2"。(默认值:"mic2"

  • download (bool, 可选) – 如果在根路径下未找到数据集,是否下载数据集。(默认值:False)。

  • url (str, 可选) – 从中下载数据集的 URL。(默认值:"https://datashare.is.ed.ac.uk/bitstream/handle/10283/3443/VCTK-Corpus-0.92.zip"

  • audio_ext (str, 可选) – 如果数据集转换为非默认音频格式,则使用自定义音频扩展名。

注意

  • 由于缺少相应的文本文件,将跳过说话者 p315 的所有语音。

  • 由于缺少音频文件,对于 mic_id="mic2",将跳过来自 p280 的所有语音。

  • 由于缺少音频文件,将跳过说话者 p362 的一些语音。

  • 另请参阅: https://datashare.is.ed.ac.uk/handle/10283/3443

__getitem__

VCTK_092.__getitem__(n: int) Tuple[Tensor, int, str, str, str][source]

从数据集中加载第 n 个样本。

参数:

n (int) – 要加载的样本的索引

返回:

以下各项的元组;

张量

波形

整数

采样率

字符串

文本记录

字符串

说话者 ID

标准差

话语 ID

文档

访问 PyTorch 的综合开发者文档

查看文档

教程

查找面向初学者和高级开发者的深度教程

查看教程

资源

查找开发资源并获得问题解答

查看资源