快捷方式

CUCTCDecoder

class torchaudio.models.decoder.CUCTCDecoder[source]

CUDA CTC 束搜索解码器。

This feature supports the following devices: CUDA

注意

要构建解码器,请使用工厂函数 cuda_ctc_decoder().

使用 CUCTCDecoder 的教程
ASR Inference with CUDA CTC Decoder

使用 CUDA CTC 解码器进行 ASR 推理

使用 CUDA CTC 解码器进行 ASR 推理

方法

__call__

CUCTCDecoder.__call__(log_prob: Tensor, encoder_out_lens: Tensor)[source]
参数::
  • log_prob (torch.FloatTensor) – 形状为 (batch, frame, num_tokens) 的 GPU 张量,存储标签上的概率分布序列;log_softmax(声学模型的输出)。

  • lengths (dpython:type torch.python:int32) – 形状为 (batch, ) 的 GPU 张量,存储每个批次中输出张量在时间轴上的有效长度。

返回::

批次中每个音频序列的已排序最佳假设列表。

返回类型::

List[List[CUCTCHypothesis]]

支持的结构

CUCTCHypothesis

class torchaudio.models.decoder.CUCTCHypothesis(tokens: List[int], words: List[str], score: float)[source]

表示由 CUCTC 束搜索解码器 CUCTCDecoder 生成的假设。

使用 CUCTCHypothesis 的教程
ASR Inference with CUDA CTC Decoder

使用 CUDA CTC 解码器进行 ASR 推理

使用 CUDA CTC 解码器进行 ASR 推理
tokens: List[int]

预测的标记 ID 序列。形状 (L, ),其中 L 是输出序列的长度

words: List[str]

预测的标记列表。与建模单元对齐。

score: float

与假设相对应的分数

文档

访问 PyTorch 的全面开发者文档

查看文档

教程

获取针对初学者和高级开发者的深入教程

查看教程

资源

查找开发资源并获得问题的解答

查看资源