VoxCeleb1Verification¶
- class torchaudio.datasets.VoxCeleb1Verification(root: Union[str, Path], meta_url: str = 'https://www.robots.ox.ac.uk/~vgg/data/voxceleb/meta/veri_test.txt', download: bool = False)[source]¶
用于说话人验证任务的VoxCeleb1 [Nagrani 等人,2017] 数据集。
每个数据样本包含一对波形、采样率、指示它们是否来自同一说话人的标签以及文件 ID。
- 参数:
root (str 或 Path) – 数据集所在或下载到的目录路径。
meta_url (str,可选) – 包含语音对列表及其对应标签的元数据文件的 URL。每行的格式为
label file_path1 file_path2". 例如: ``1 id10270/x6uYqmx31kE/00001.wav id10270/8jEAjG6SegY/00008.wav
。1
表示这两个语音来自同一说话人,0
表示不是。(默认值:"https://www.robots.ox.ac.uk/~vgg/data/voxceleb/meta/veri_test.txt"
)download (bool,可选) – 如果在根路径下找不到数据集,是否下载数据集。(默认值:
False
)。
注意
VoxCeleb1Verification 数据集的文件结构如下
└─ root/
└─ wav/
└─ speaker_id 文件夹
预先下载了
"vox1_dev_wav.zip"
和"vox1_test_wav.zip"
文件的用户需要将解压缩后的文件移动到同一个root
目录中。