快捷方式

choose_qparams_affine_with_min_max

torchao.quantization.choose_qparams_affine_with_min_max(min_val: Tensor, max_val: Tensor, mapping_type: MappingType, block_size: Tuple[int, ...], target_dtype: dtype, quant_min: Optional[int] = None, quant_max: Optional[int] = None, eps: Optional[float] = None, scale_dtype: Optional[dtype] = None, zero_point_dtype: Optional[dtype] = None, preserve_zero: bool = True, zero_point_domain: Optional[ZeroPointDomain] = ZeroPointDomain.INT) Tuple[Tensor, Tensor][源代码]

choose_qparams_affine() 运算符的变体,直接传入 min_val 和 max_val,而不是从单个输入中导出这些值。这用于静态量化中的观察者,其中 min_val 和 max_val 可以通过跟踪校准数据集中的所有数据来获得。

:param 与 choose_qparams_affine() 大致相同。有一个 :param 区别:不是传入 input Tensor 并使用它来计算 min_val/max_val :param 然后缩放/零点::param 我们直接传入 min_val/max_val

文档

访问 PyTorch 的全面开发者文档

查看文档

教程

获取面向初学者和高级开发者的深度教程

查看教程

资源

查找开发资源并获得问题解答

查看资源