快捷方式

DTypeWithConstraints

class torch.ao.quantization.backend_config.DTypeWithConstraints(dtype=None, quant_min_lower_bound=None, quant_max_upper_bound=None, scale_min_lower_bound=None, scale_max_upper_bound=None, scale_exact_match=None, zero_point_exact_match=None)[源代码]

用于为给定数据类型指定附加约束的配置,例如量化值范围、比例值范围和固定量化参数,将在 DTypeConfig 中使用。

当前支持的约束包括

  • quant_min_lower_boundquant_max_upper_bound:分别为最小和最大量化值的上下限。如果 QConfig 的 quant_minquant_max 超出此范围,则该 QConfig 将被忽略。

  • scale_min_lower_boundscale_max_upper_bound:分别为最小和最大比例值的上下限。如果 QConfig 的最小比例值(目前公开为 eps)低于下限,则该 QConfig 将被忽略。请注意,目前没有强制执行上限。

  • scale_exact_matchzero_point_exact_match:比例和零点的精确匹配要求,用于具有固定量化参数的运算符,例如 sigmoid 和 tanh。如果 QConfig 中指定的观察者既不是 FixedQParamsObserver 也不是 FixedQParamsFakeQuantize,或者如果量化参数不匹配,则该 QConfig 将被忽略。

文档

访问 PyTorch 的全面开发者文档

查看文档

教程

获取针对初学者和高级开发人员的深入教程

查看教程

资源

查找开发资源并解答你的问题

查看资源