Wav2Vec2FABundle.Aligner¶
- class torchaudio.pipelines.Wav2Vec2FABundle.Aligner¶
对齐器的接口
方法¶
__call__¶
- abstract Aligner.__call__(emission: Tensor, tokens: List[List[int]]) List[List[TokenSpan]] ¶
生成带时间戳的 token 序列列表
- 参数:
emission (Tensor) – 对数域中的 token 概率分布序列。形状:(时间, token)。
tokens (python:integer sequence 的列表) – Tokenization 后的文本。来自
torchaudio.pipelines.Wav2Vec2FABundle.Tokenizer
的输出。
- 返回:
带时间戳和分数的 token。
- 返回类型:
(TokenSpan 序列的列表)