int_scaled_matmul¶
- torchao.quantization.int_scaled_matmul(a: Tensor, b: Tensor, scales1: Tensor) Tensor [source]¶
执行缩放的整数矩阵乘法。
- 参数:
a (torch.Tensor) – 要相乘的第一个矩阵。
b (torch.Tensor) – 要相乘的第二个矩阵。
scales1 (torch.Tensor) – 结果行缩放因子。
- 返回:
缩放矩阵乘法的结果。
- 返回类型:
- Raises:
AssertionError – 如果输入张量的维度与预期形状不匹配。