Wav2Vec2FABundle.Aligner¶
- class torchaudio.pipelines.Wav2Vec2FABundle.Aligner¶
对齐器的接口
方法¶
__call__¶
- abstract Aligner.__call__(emission: Tensor, tokens: List[List[int]]) List[List[TokenSpan]] ¶
生成带时间戳的 token 序列列表
- 参数:
emission (Tensor) – 对数域中的 token 概率分布序列。形状:(time, tokens)。
tokens (list of python:integer sequence) – Tokenized transcript。来自
torchaudio.pipelines.Wav2Vec2FABundle.Tokenizer
的输出。
- 返回:
带有时间戳和分数的 Tokens。
- 返回类型:
(TokenSpan 序列列表)