SquimSubjective¶
- class torchaudio.models.SquimSubjective(ssl_model: Module, projector: Module, predictor: Module)[source]¶
语音质量和可懂度指标 (SQUIM) 模型,用于预测语音增强的主观指标分数(例如,平均意见得分 (MOS))。该模型采纳自 NORESQA-MOS [Manocha and Kumar, 2022],该模型在给定输入语音和非匹配参考的情况下预测 MOS 分数。
- 参数:
ssl_model (torch.nn.Module) – 用于特征提取的自监督学习模型。
projector (torch.nn.Module) – 将 SSL 特征投影到较低维度的投影层。
predictor (torch.nn.Module) – 预测主观分数。
- 使用
SquimSubjective
的教程
方法¶
forward¶
- SquimSubjective.forward(waveform: Tensor, reference: Tensor)[source]¶
预测主观评估指标分数。
- 参数:
waveform (torch.Tensor) – 用于评估的输入波形。维度为 (batch, time) 的张量。
reference (torch.Tensor) – 非匹配的干净参考。维度为 (batch, time_ref) 的张量。
- 返回值:
主观指标分数。维度为 (batch,) 的张量。
- 返回类型:
工厂函数¶
构建自定义的 |
|
使用默认参数构建 |