快捷方式

torchaudio.functional.merge_tokens

torchaudio.functional.merge_tokens(tokens: Tensor, scores: Tensor, blank: int = 0) List[TokenSpan][source]

从给定的 CTC 令牌序列中移除重复令牌和空白令牌。

参数:
  • tokens (Tensor) – 从 forced_align() 返回的对齐令牌(未批量处理)。形状:(time, )

  • scores (Tensor) – 从 forced_align() 返回的对齐分数(未批量处理)。形状:(time, )。计算令牌大小分数时,给定的分数在相应的时间跨度内取平均值。

返回:

TokenSpan 列表

示例

>>> aligned_tokens, scores = forced_align(emission, targets, input_lengths, target_lengths)
>>> token_spans = merge_tokens(aligned_tokens[0], scores[0])
使用 merge_tokens 的教程
CTC forced alignment API tutorial

CTC 强制对齐 API 教程

CTC 强制对齐 API 教程
Forced alignment for multilingual data

多语言数据的强制对齐

多语言数据的强制对齐

文档

访问 PyTorch 的全面开发者文档

查看文档

教程

获取面向初学者和高级开发者的深度教程

查看教程

资源

查找开发资源并获得问题的解答

查看资源