SquimSubjective¶
- class torchaudio.models.SquimSubjective(ssl_model: Module, projector: Module, predictor: Module)[source]¶
语音质量和清晰度度量 (SQUIM) 模型,用于预测语音增强(例如,平均意见得分 (MOS))的**主观**度量得分。该模型改编自NORESQA-MOS [Manocha 和 Kumar,2022],该模型在给定输入语音和非匹配参考的情况下预测 MOS 分数。
- 参数::
ssl_model (torch.nn.Module) – 用于特征提取的自监督学习模型。
projector (torch.nn.Module) – 将 SSL 特征投影到更低维度的投影层。
predictor (torch.nn.Module) – 预测主观分数。
- 使用
SquimSubjective
的教程 Torchaudio-Squim:Torchaudio 中的非侵入式语音评估
Torchaudio-Squim:Torchaudio 中的非侵入式语音评估
方法¶
forward¶
- SquimSubjective.forward(waveform: Tensor, reference: Tensor)[source]¶
预测主观评估指标得分。
- 参数::
waveform (torch.Tensor) – 用于评估的输入波形。维数为 (batch, time) 的张量。
reference (torch.Tensor) – 非匹配的干净参考。维数为 (batch, time_ref) 的张量。
- 返回::
主观度量得分。维数为 (batch,) 的张量。
- 返回类型::
工厂函数¶
构建自定义 |
|
使用默认参数构建 |