torch.nn.attention¶ 此模块包含更改 torch.nn.functional.scaled_dot_product_attention 行为的函数和类。 实用程序¶ sdpa_kernel 上下文管理器,用于选择用于缩放点积注意力的后端。 SDPBackend 包含缩放点积注意力的不同后端的类似枚举的类。 子模块¶ bias 定义与 scaled_dot_product_attention 协同工作的偏差子类