快捷方式

float8_weight_only

torchao.quantization.float8_weight_only(weight_dtype: dtype = torch.float8_e4m3fn)[source]

对线性层应用 float8 权重仅对称逐通道量化。

参数:

weight_dtype (torch.dtype) – 权重量化的目标数据类型。默认为 torch.float8_e4m3fn。

注意

实际的矩阵乘法将在权重张量的原始精度下计算。

文档

访问 PyTorch 的全面开发者文档

查看文档

教程

获取面向初学者和高级开发者的深入教程

查看教程

资源

查找开发资源并获得解答

查看资源