快捷方式

generate_next_token

torchtune.generation.generate_next_token(model: TransformerDecoder, input_pos: Tensor, x: Tensor, q: Optional[Tensor] = None, *, mask: Optional[Tensor] = None, temperature: float = 1.0, top_k: Optional[int] = None) Tuple[Tensor, Tensor][source]

根据提示生成下一个 token,并返回相应的 logits。

参数:
返回值:

包含两个 tensor 的元组
  • tokens (torch.Tensor): 包含生成的 token 的 tensor,

    形状为 [bsz x 1]。

  • logits (torch.Tensor): 包含与生成的 token 相关的 logits 的 tensor,

    形状为 [bsz x 1 x vocab_size]。

返回类型:

Tuple[torch.Tensor, torch.Tensor]

文档

查阅 PyTorch 全面的开发者文档

查看文档

教程

获取面向初学者和高级开发者的深度教程

查看教程

资源

查找开发资源并获得问题的解答

查看资源