快捷方式

MPS 环境变量

PyTorch 环境变量

变量

描述

PYTORCH_DEBUG_MPS_ALLOCATOR

如果设置为 1,则将分配器日志记录级别设置为详细。

PYTORCH_MPS_LOG_PROFILE_INFO

将日志选项位掩码设置为 MPSProfiler。有关可用选项,请参阅 aten/src/ATen/mps/MPSProfiler.h 中的 LogOptions 枚举。

PYTORCH_MPS_TRACE_SIGNPOSTS

将配置文件和信标位掩码设置为 MPSProfiler。有关可用选项,请参阅 aten/src/ATen/mps/MPSProfiler.h 中的 ProfileOptionsSignpostTypes 枚举。

PYTORCH_MPS_HIGH_WATERMARK_RATIO

MPS 分配器的最高水位线比率。默认情况下,设置为 1.7。

PYTORCH_MPS_LOW_WATERMARK_RATIO

MPS 分配器的最低水位线比率。默认情况下,如果内存是统一的,则设置为 1.4;如果内存是离散的,则设置为 1.0。

PYTORCH_MPS_FAST_MATH

如果设置为 1,则为 MPS metal 内核启用快速数学。有关精度影响,请参阅 https://developer.apple.com/metal/Metal-Shading-Language-Specification.pdf 中的第 1.6.3 节。

PYTORCH_MPS_PREFER_METAL

如果设置为 1,则强制使用 metal 内核而不是使用 MPS 图 API。目前,这仅用于矩阵乘法运算。

PYTORCH_ENABLE_MPS_FALLBACK

如果设置为 1,则在 MPS 不支持操作时回退到 CPU。

注意

**最高水位线比率** 是允许的总分配量的硬性限制

  • 0.0:禁用最高水位线限制(如果发生系统范围内的内存不足错误,可能会导致系统故障)

  • 1.0:推荐的最大分配大小(即 device.recommendedMaxWorkingSetSize)

  • >1.0:允许超出 device.recommendedMaxWorkingSetSize 的限制

例如,值 0.95 表示我们最多分配推荐的最大分配大小的 95%;超过此值,分配将因内存不足错误而失败。

**最低水位线比率** 是一个软性限制,试图通过垃圾回收或更频繁地提交命令缓冲区(也称为自适应提交)来将内存分配限制到最低水位线级别。值介于 0 到 m_high_watermark_ratio 之间(设置 0.0 将禁用自适应提交和垃圾回收)例如,值 0.9 表示我们“尝试”将分配限制到推荐的最大分配大小的 90%。

文档

访问 PyTorch 的全面开发者文档

查看文档

教程

获取初学者和高级开发人员的深入教程

查看教程

资源

查找开发资源并获得问题的解答

查看资源