FusedMovingAvgObsFakeQuantize¶
- class torch.ao.quantization.fake_quantize.FusedMovingAvgObsFakeQuantize(observer=<class 'torch.ao.quantization.observer.MovingAverageMinMaxObserver'>, quant_min=0, quant_max=255, **observer_kwargs)[源代码]¶
定义一个融合模块来观察张量。
用于观察输入张量(计算最小值/最大值)、计算比例/零点并对张量进行伪量化的融合模块。此模块使用与 MovingAverageMinMaxObserver 类似的计算方法来处理输入,以计算最小值/最大值,以便计算比例/零点。观察器中的 qscheme 输入用于区分对称/仿射量化方案。
此模块的输出由 x_out = (clamp(round(x/scale + zero_point), quant_min, quant_max)-zero_point)*scale 给出
类似于
FakeQuantize
,并接受与基类相同的属性。