快捷方式

quantize

class torch.ao.quantization.quantize(model, run_fn, run_args, mapping=None, inplace=False)[source][source]

使用训练后静态量化对输入的浮点模型进行量化。

首先,它会准备模型进行校准,然后调用 run_fn 运行校准步骤,之后我们将模型转换为量化模型。

参数
  • model – 输入浮点模型

  • run_fn – 用于校准已准备模型的校准函数

  • run_argsrun_fn 的位置参数

  • inplace – 就地执行模型转换,原始模块将被修改

  • mapping – 原始模块类型与量化对应物之间的对应关系

返回

量化模型。

文档

访问 PyTorch 的全面开发者文档

查看文档

教程

获取针对初学者和高级开发者的深入教程

查看教程

资源

查找开发资源并获得问题解答

查看资源