快捷方式

VCTK_092

class torchaudio.datasets.VCTK_092(root: str, mic_id: str = 'mic2', download: bool = False, url: str = 'https://datashare.is.ed.ac.uk/bitstream/handle/10283/3443/VCTK-Corpus-0.92.zip', audio_ext='.flac')[source]

VCTK 0.92 [Yamagishi 等人,2019] 数据集

参数:
  • root (str) – 数据集顶层目录所在的根目录。

  • mic_id (str, 可选) – 麦克风 ID。可以是 "mic1""mic2"。(默认值:"mic2"

  • download (bool, 可选) – 如果在根路径下找不到数据集,是否下载。(默认值:False)。

  • url (str, 可选) – 下载数据集的 URL。(默认值:"https://datashare.is.ed.ac.uk/bitstream/handle/10283/3443/VCTK-Corpus-0.92.zip"

  • audio_ext (str, 可选) – 如果数据集转换为非默认音频格式,则自定义音频扩展名。

注意

  • 由于缺少相应的文本文件,将跳过来自说话人 p315 的所有语音。

  • 对于 mic_id="mic2",将跳过来自 p280 的所有语音,因为缺少音频文件。

  • 由于缺少音频文件,将跳过来自说话人 p362 的部分语音。

  • 另请参阅:https://datashare.is.ed.ac.uk/handle/10283/3443

__getitem__

VCTK_092.__getitem__(n: int) Tuple[Tensor, int, str, str, str][source]

加载数据集中第 n 个样本。

参数:

n (int) – 要加载的样本索引

返回值:

以下项目的元组;

张量

波形

整数

采样率

字符串

转录文本

字符串

说话人 ID

标准差

话语 ID

文档

访问 PyTorch 的全面开发者文档

查看文档

教程

获取适合初学者和高级开发人员的深度教程

查看教程

资源

查找开发资源并获取问题的解答

查看资源