swap_linear_with_smooth_fq_linear¶
- torchao.quantization.swap_linear_with_smooth_fq_linear(model, skip_fqn_list=None, cur_fqn='', alpha=0.5) None [源代码]¶
将模型中的线性层替换为其 SmoothFakeDynamicallyQuantizedLinear 等效项。
- 参数:
model (torch.nn.Module) – 包含要替换的线性层的模型。
skip_fqn_list (list of str, optional) – 在替换期间要跳过的完全限定名称列表。默认为 None。
cur_fqn (str, optional) – 正在处理的模块的当前完全限定名称。默认为 “”。
alpha (float, optional) – SmoothQuant 的缩放因子。默认为 0.5。
- 返回值:
None