FusedMovingAvgObsFakeQuantize¶
- class torch.ao.quantization.fake_quantize.FusedMovingAvgObsFakeQuantize(observer=<class 'torch.ao.quantization.observer.MovingAverageMinMaxObserver'>, quant_min=0, quant_max=255, **observer_kwargs)[source][source]¶
定义一个融合模块来观察张量。
融合模块用于观察输入张量(计算最小值/最大值),计算scale/zero_point并对张量进行伪量化。此模块对输入使用类似于 MovingAverageMinMaxObserver 的计算,以计算最小值/最大值,从而计算scale/zero_point。观察器中的 qscheme 输入用于区分对称/仿射量化方案。
此模块的输出由 x_out = (clamp(round(x/scale + zero_point), quant_min, quant_max)-zero_point)*scale 给出
类似于
FakeQuantize
,并接受与基类相同的属性。