torch.nn.attention.sdpa_kernel¶

torch.nn.attention.sdpa_kernel(backends, set_priority=False)[源代码][源代码]¶

用于选择用于缩放点积注意力后端的上下文管理器。

警告

此函数为测试版，可能会发生变化。

参数

backends (Union[List[SDPBackend], SDPBackend]) – 用于缩放点积注意力后端的列表或单个后端。
set_priority_order (python:bool=False) – 后端列表的顺序是否解释为其优先级顺序。

示例

from torch.nn.functional import scaled_dot_product_attention
from torch.nn.attention import SDPBackend, sdpa_kernel
# Only enable flash attention backend
with sdpa_kernel(SDPBackend.FLASH_ATTENTION):
    scaled_dot_product_attention(...)

# Enable the Math or Efficient attention backends
with sdpa_kernel([SDPBackend.MATH, SDPBackend.EFFICIENT_ATTENTION]):
    scaled_dot_product_attention(...)

此上下文管理器可用于选择用于缩放点积注意力后端。退出上下文管理器后，将恢复之前的标志状态，启用所有后端。

torch.nn.attention.sdpa_kernel¶

文档

教程

资源