快捷方式

Wav2Letter

class torchaudio.models.Wav2Letter(num_classes: int = 40, input_type: str = 'waveform', num_features: int = 1)[source]

来自Wav2Letter:基于端到端卷积神经网络的语音识别系统[Collobert 等人,2016] 的 Wav2Letter 模型架构。

另请参阅

参数:
  • num_classes (int, 可选) – 要分类的类别数。 (默认值: 40)

  • input_type (str, 可选) – Wav2Letter 可以使用以下内容作为输入: waveformpower_spectrummfcc (默认值: waveform)。

  • num_features (int, 可选) – 网络将接收的输入特征数 (默认值: 1)。

方法

forward

Wav2Letter.forward(x: Tensor) Tensor[source]
参数:

x (torch.Tensor) – 维度为 (batch_size, num_features, input_length) 的张量。

返回值:

维度为 (batch_size, number_of_classes, input_length) 的预测器张量。

返回类型:

张量

文档

访问 PyTorch 的全面开发者文档

查看文档

教程

获取面向初学者和高级开发人员的深入教程

查看教程

资源

查找开发资源并获得问题的解答

查看资源