VoxCeleb1Verification¶
- class torchaudio.datasets.VoxCeleb1Verification(root: Union[str, Path], meta_url: str = 'https://www.robots.ox.ac.uk/~vgg/data/voxceleb/meta/veri_test.txt', download: bool = False)[source]¶
VoxCeleb1 [Nagrani et al., 2017] 数据集,用于说话人验证任务。
每个数据样本包含一对波形、采样率、指示它们是否来自同一说话人的标签以及文件 ID。
- 参数:
root (str 或 Path) – 数据集所在或下载到的目录的路径。
meta_url (str, 可选) – 包含话语对列表和相应标签的元文件的 URL。每行的格式为
label file_path1 file_path2"
。例如:``1 id10270/x6uYqmx31kE/00001.wav id10270/8jEAjG6SegY/00008.wav``
。1
表示两个话语来自同一说话人,0
表示不是。(默认值:"https://www.robots.ox.ac.uk/~vgg/data/voxceleb/meta/veri_test.txt"
)download (bool, 可选) – 如果在根路径下未找到数据集,是否下载数据集。(默认值:
False
)。
注意
VoxCeleb1Verification 数据集的文件结构如下
└─ root/
└─ wav/
└─ speaker_id 文件夹
预先下载了
"vox1_dev_wav.zip"
和"vox1_test_wav.zip"
文件的用户需要将解压后的文件移动到同一root
目录中。