快捷方式

cuda_ctc_decoder

torchaudio.models.decoder.cuda_ctc_decoder(tokens: Union[str, List[str]], nbest: int = 1, beam_size: int = 10, blank_skip_threshold: float = 0.95) CUCTCDecoder[source]

构建 CUCTCDecoder 的实例。

参数:
  • tokens (strList[str]) – 包含有效标记的文件或列表。如果使用文件,则期望格式为映射到相同索引的标记位于同一行

  • beam_size (int, 可选) – 每个解码步骤后最多保存的假设数 (默认值:10)

  • nbest (int) – 返回的最佳解码数量

  • blank_id (int) – 与空白符号对应的标记 ID。

  • blank_skip_threshold (float) – 如果 log_prob(blank) > log(blank_skip_threshold),则跳过帧,以加快解码速度 (默认值:0.95)。

返回:

解码器

返回类型:

CUCTCDecoder

示例
>>> decoder = cuda_ctc_decoder(
>>>     vocab_file="tokens.txt",
>>>     blank_skip_threshold=0.95,
>>> )
>>> results = decoder(log_probs, encoder_out_lens) # List of shape (B, nbest) of Hypotheses
使用 cuda_ctc_decoder 的教程
ASR Inference with CUDA CTC Decoder

使用 CUDA CTC 解码器进行 ASR 推理

使用 CUDA CTC 解码器进行 ASR 推理

文档

访问 PyTorch 的全面开发者文档

查看文档

教程

获取针对初学者和高级开发人员的深入教程

查看教程

资源

查找开发资源并获得问题的解答

查看资源