torchaudio.functional.merge_tokens¶

torchaudio.functional.merge_tokens(tokens: Tensor, scores: Tensor, blank: int = 0) → List[TokenSpan][source]¶

从给定的 CTC 令牌序列中移除重复令牌和空白令牌。

参数：

tokens (Tensor) – 从 forced_align() 返回的对齐令牌（未批量处理）。形状：(time, )。
scores (Tensor) – 从 forced_align() 返回的对齐分数（未批量处理）。形状：(time, )。计算令牌大小分数时，给定的分数在相应的时间跨度内取平均值。

返回：

TokenSpan 列表

示例

>>> aligned_tokens, scores = forced_align(emission, targets, input_lengths, target_lengths)
>>> token_spans = merge_tokens(aligned_tokens[0], scores[0])

使用 merge_tokens 的教程: CTC 强制对齐 API 教程

CTC 强制对齐 API 教程

多语言数据的强制对齐

多语言数据的强制对齐

torchaudio.functional.merge_tokens¶

文档

教程

资源