torch.nn.attention¶ 此模块包含修改 torch.nn.functional.scaled_dot_product_attention 行为的函数和类 实用程序¶ sdpa_kernel 上下文管理器,用于选择要用于缩放点积注意力的后端。 SDPBackend 包含缩放点积注意力不同后端的类似枚举的类。 子模块¶ flex_attention 此模块实现了 PyTorch 中 flex_attention 的用户界面 API。 bias 定义与 scaled_dot_product_attention 一起使用的偏差子类