快捷方式

SquimSubjective

class torchaudio.models.SquimSubjective(ssl_model: Module, projector: Module, predictor: Module)[source]

语音质量和可懂度评估 (SQUIM) 模型,用于预测用于语音增强的主观指标得分(例如,平均主观意见分数 (MOS))。该模型改编自 NORESQA-MOS [Manocha and Kumar, 2022],它根据输入语音和非匹配参考预测 MOS 分数。

参数:
使用 SquimSubjective 的教程
Torchaudio-Squim: Non-intrusive Speech Assessment in TorchAudio

Torchaudio-Squim:Torchaudio 中的非侵入式语音评估

Torchaudio-Squim:Torchaudio 中的非侵入式语音评估

方法

forward

SquimSubjective.forward(waveform: Tensor, reference: Tensor)[source]

预测主观评估指标得分。

参数:
  • waveform (torch.Tensor) – 用于评估的输入波形。维度为 (batch, time) 的 Tensor。

  • reference (torch.Tensor) – 非匹配的干净参考。维度为 (batch, time_ref) 的 Tensor。

返回:

主观指标得分。维度为 (batch,) 的 Tensor。

返回类型:

(torch.Tensor)

工厂函数

squim_subjective_model

构建一个自定义的 torchaudio.prototype.models.SquimSubjective 模型。

squim_subjective_base

使用默认参数构建 torchaudio.prototype.models.SquimSubjective 模型。

文档

访问 PyTorch 的完整开发者文档

查看文档

教程

获取针对初学者和高级开发者的深度教程

查看教程

资源

查找开发资源并获取问题解答

查看资源