快捷方式

Wav2Letter

class torchaudio.models.Wav2Letter(num_classes: int = 40, input_type: str = 'waveform', num_features: int = 1)[source]

Wav2Letter 模型架构,源自 Wav2Letter: 一个端到端基于 ConvNet 的语音识别系统 [Collobert 等人, 2016]

另请参阅

参数:
  • num_classes (int, 可选) – 需要分类的类别数量。(默认值: 40)

  • input_type (str, 可选) – Wav2Letter 可以使用的输入类型:waveformpower_spectrummfcc。(默认值: waveform)。

  • num_features (int, 可选) – 网络将接收的输入特征数量。(默认值: 1)。

方法

forward

Wav2Letter.forward(x: Tensor) Tensor[source]
参数:

x (torch.Tensor) – 维度为 (batch_size, num_features, input_length) 的张量。

返回值:

预测器张量,维度为 (batch_size, number_of_classes, input_length)。

返回值类型:

Tensor

文档

访问 PyTorch 的完整开发者文档

查看文档

教程

获取面向初学者和高级开发者的深入教程

查看教程

资源

查找开发资源并获取问题解答

查看资源