目录

快捷方式

Wav2Letter¶

class torchaudio.models.Wav2Letter(num_classes: int = 40, input_type: str = 'waveform', num_features: int = 1)[source]¶

Wav2Letter 模型架构，源自 Wav2Letter: 一个端到端基于 ConvNet 的语音识别系统 [Collobert 等人, 2016]。

另请参阅

训练示例

参数：

num_classes (int, 可选) – 需要分类的类别数量。(默认值: 40)
input_type (str, 可选) – Wav2Letter 可以使用的输入类型：waveform、power_spectrum 或 mfcc。(默认值: waveform)。
num_features (int, 可选) – 网络将接收的输入特征数量。(默认值: 1)。

方法¶

forward¶

Wav2Letter.forward(x: Tensor) → Tensor[source]¶

参数：: x (torch.Tensor) – 维度为 (batch_size, num_features, input_length) 的张量。
返回值：: 预测器张量，维度为 (batch_size, number_of_classes, input_length)。
返回值类型：: Tensor

文档

访问 PyTorch 的完整开发者文档

查看文档

教程

获取面向初学者和高级开发者的深入教程

查看教程

资源

查找开发资源并获取问题解答

查看资源