torchaudio.functional.merge_tokens¶
- torchaudio.functional.merge_tokens(tokens: Tensor, scores: Tensor, blank: int = 0) List[TokenSpan] [source]¶
从给定的 CTC token 序列中删除重复的 token 和空白 token。
- 参数:
tokens (Tensor) – 由
forced_align()
返回的对齐 token(未批处理)。形状:(time, )。scores (Tensor) – 由
forced_align()
返回的对齐分数(未批处理)。形状:(time, )。计算 token 大小分数时,给定分数在相应的时间跨度内取平均值。
- 返回值:
TokenSpan 列表
示例
>>> aligned_tokens, scores = forced_align(emission, targets, input_lengths, target_lengths) >>> token_spans = merge_tokens(aligned_tokens[0], scores[0])
- 使用
merge_tokens
的教程 - CTC 强制对齐 API 教程多语言数据的强制对齐