HistogramObserver¶
- class torch.ao.quantization.observer.HistogramObserver(bins=2048, dtype=torch.quint8, qscheme=torch.per_tensor_affine, reduce_range=False, quant_min=None, quant_max=None, factory_kwargs=None, eps=1.1920928955078125e-07, is_dynamic=False, **kwargs)[源代码][源代码]¶
该模块记录 tensor 值的运行直方图以及 min/max 值。
calculate_qparams
将计算 scale 和 zero_point。- 参数
scale 和 zero point 的计算如下
- 创建输入数据的直方图。
直方图持续计算,每个 bin 的范围随每个新观察到的 tensor 而变化。
- 在直方图中搜索最优 min/max 值。
min/max 值的搜索确保了相对于浮点模型的量化误差最小化。
- 以与以下方式相同的方式计算 scale 和 zero point:
MinMaxObserver