choose_qparams_affine_with_min_max¶

torchao.quantization.choose_qparams_affine_with_min_max(min_val: Tensor, max_val: Tensor, mapping_type: MappingType, block_size: Tuple[int, ...], target_dtype: dtype, quant_min: Optional[int] = None, quant_max: Optional[int] = None, eps: Optional[float] = None, scale_dtype: Optional[dtype] = None, zero_point_dtype: Optional[dtype] = None, preserve_zero: bool = True, zero_point_domain: ZeroPointDomain = ZeroPointDomain.INT) → Tuple[Tensor, Tensor][source]¶

`choose_qparams_affine()` 算子的一个变体，直接传入 min_val 和 max_val，而不是从单个输入中导出它们。这用于静态量化中的观察者，其中 min_val 和 max_val 可能通过跟踪校准数据集中的所有数据来获得。

:param 大部分与 `choose_qparams_affine()` 相同。有一个: :param 区别：我们不是传入 `input` 张量并用它来计算 min_val/max_val :param 然后计算 scale/zero_point: :param 而是直接传入 min_val/max_val

choose_qparams_affine_with_min_max¶

文档

教程

资源