Wav2Vec2FABundle.Tokenizer¶ class torchaudio.pipelines.Wav2Vec2FABundle.Tokenizer¶ 分词器的接口 方法¶ __call__¶ abstract Tokenizer.__call__(transcript: List[str]) → List[List[str]]¶ 对给定的文本记录(单词列表)进行分词 注意 toranscript 必须是标准化的。 参数: transcript (list of str) – 文本记录(单词列表)。 返回值: 分词序列列表 返回类型: (int 列表)