快捷方式

CUCTCDecoder

class torchaudio.models.decoder.CUCTCDecoder[source]

CUDA CTC 集束搜索解码器。

This feature supports the following devices: CUDA

注意

要构建解码器,请使用工厂函数 cuda_ctc_decoder()

使用 CUCTCDecoder 的教程
ASR Inference with CUDA CTC Decoder

使用 CUDA CTC 解码器进行 ASR 推理

使用 CUDA CTC 解码器进行 ASR 推理

方法

__call__

CUCTCDecoder.__call__(log_prob: Tensor, encoder_out_lens: Tensor)[source]
参数:
  • log_prob (torch.FloatTensor) – 形状为 (batch, frame, num_tokens) 的 GPU 张量,存储标签上的概率分布序列;log_softmax(声学模型的输出)。

  • lengths (dpython:type torch.python:int32) – 形状为 (batch, ) 的 GPU 张量,存储每个批次中输出张量在时间轴上的有效长度。

返回:

批次中每个音频序列的排序最佳假设列表。

返回类型:

List[List[CUCTCHypothesis]]

支持结构

CUCTCHypothesis

class torchaudio.models.decoder.CUCTCHypothesis(tokens: List[int], words: List[str], score: float)[source]

表示由 CUCTC 集束搜索解码器 CUCTCDecoder 生成的假设。

使用 CUCTCHypothesis 的教程
ASR Inference with CUDA CTC Decoder

使用 CUDA CTC 解码器进行 ASR 推理

使用 CUDA CTC 解码器进行 ASR 推理
tokens: List[int]

预测的 token ID 序列。形状 (L, ),其中 L 是输出序列的长度

words: List">[str]

预测的 token 列表。与建模单元对齐。

score: float

与假设对应的分数

文档

访问 PyTorch 的综合开发者文档

查看文档

教程

获取面向初学者和高级开发者的深入教程

查看教程

资源

查找开发资源并获得您的问题解答

查看资源