torchaudio.datasets¶

所有数据集都是 torch.utils.data.Dataset 的子类，并实现了 __getitem__ 和 __len__ 方法。

因此，它们都可以传递给 torch.utils.data.DataLoader，后者可以使用 torch.multiprocessing worker 并行加载多个样本。例如

yesno_data = torchaudio.datasets.YESNO('.', download=True)
data_loader = torch.utils.data.DataLoader(
    yesno_data,
    batch_size=1,
    shuffle=True,
    num_workers=args.nThreads)

`CMUARCTIC`	CMU ARCTIC [Kominek 等, 2003] 数据集。
`CMUDict`	CMU Pronouncing Dictionary [Weide, 1998] (CMUDict) 数据集。
`COMMONVOICE`	CommonVoice [Ardila 等, 2020] 数据集。
`DR_VCTK`	Device Recorded VCTK (Small subset version) [Sarfjoo 和 Yamagishi, 2018] 数据集。
`FluentSpeechCommands`	Fluent Speech Commands [Lugosch 等, 2019] 数据集
`GTZAN`	GTZAN [Tzanetakis 等, 2001] 数据集。
`IEMOCAP`	IEMOCAP [Busso 等, 2008] 数据集。
`LibriMix`	LibriMix [Cosentino 等, 2020] 数据集。
`LIBRISPEECH`	LibriSpeech [Panayotov 等, 2015] 数据集。
`LibriLightLimited`	Libri-light [Kahn 等, 2020] 数据集的子集，该子集在 HuBERT [Hsu 等, 2021] 中用于监督微调。
`LIBRITTS`	LibriTTS [Zen 等, 2019] 数据集。
`LJSPEECH`	LJSpeech-1.1 [Ito 和 Johnson, 2017] 数据集。
`MUSDB_HQ`	MUSDB_HQ [Rafii 等, 2019] 数据集。
`QUESST14`	QUESST14 [Miro 等, 2015] 数据集。
`Snips`	Snips [Coucke 等, 2018] 数据集。
`SPEECHCOMMANDS`	Speech Commands [Warden, 2018] 数据集。
`TEDLIUM`	Tedlium [Rousseau 等, 2012] 数据集 (releases 1,2 and 3)。
`VCTK_092`	VCTK 0.92 [Yamagishi 等, 2019] 数据集
`VoxCeleb1Identification`	VoxCeleb1 [Nagrani 等, 2017] 数据集，用于说话人识别任务。
`VoxCeleb1Verification`	VoxCeleb1 [Nagrani 等, 2017] 数据集，用于说话人验证任务。
`YESNO`	YesNo [YesNo, n.d.] 数据集。

torchaudio.datasets¶

文档

教程

资源