量化¶
- class torch.ao.quantization.quantize(model, run_fn, run_args, mapping=None, inplace=False)[source]¶
使用训练后静态量化对输入浮点模型进行量化。
首先,它将准备模型以进行校准,然后它调用 run_fn,该函数将运行校准步骤,之后我们将模型转换为量化模型。
- 参数
model – 输入浮点模型
run_fn – 用于校准准备好的模型的校准函数
run_args – run_fn 的位置参数
inplace – 就地执行模型转换,原始模块将被修改
mapping – 原始模块类型与其量化对应项之间的对应关系
- 返回值
量化模型。