torch.nn.attention¶ 此模块包含用于更改 torch.nn.functional.scaled_dot_product_attention 行为的函数和类 实用程序¶ sdpa_kernel 上下文管理器,用于选择用于缩放点积注意的哪个后端。 SDPBackend 一个类似枚举的类,包含用于缩放点积注意的不同后端。 子模块¶ bias 定义与 scaled_dot_product_attention 一起使用的偏差子类