快捷方式

Wav2Letter

class torchaudio.models.Wav2Letter(num_classes: int = 40, input_type: str = 'waveform', num_features: int = 1)[source]

来自 Wav2Letter: an End-to-End ConvNet-based Speech Recognition System [Collobert et al., 2016] 的 Wav2Letter 模型架构。

另请参阅

参数:
  • num_classes (int, 可选) – 要分类的类别数量。(默认值:40

  • input_type (str, 可选) – Wav2Letter 可以用作输入:waveformpower_spectrummfcc(默认值:waveform)。

  • num_features (int, 可选) – 网络将接收的输入特征数量(默认值:1)。

方法

forward

Wav2Letter.forward(x: Tensor) Tensor[source]
参数:

x (torch.Tensor) – 维度为(batch_size,num_features,input_length)的张量。

返回值:

维度为(batch_size,number_of_classes,input_length)的预测张量。

返回类型:

Tensor

文档

访问 PyTorch 的全面开发者文档

查看文档

教程

获取面向初学者和高级开发者的深入教程

查看教程

资源

查找开发资源并获得您的问题解答

查看资源