torchao.sparsity¶

`sparsify_`	使用 apply_tensor_subclass 转换模型中线性模块的权重。
`semi_sparse_weight`	将线性模块的权重转换为半结构化 (2:4) 稀疏性
`int8_dynamic_activation_int8_semi_sparse_weight`	将 int8 动态对称逐 token 激活和 int8 逐通道权重量化 + 2:4 稀疏性应用于线性层。
`apply_fake_sparsity`	此函数在模型中的所有线性层上模拟 2:4 稀疏性。
`WandaSparsifier`	Wanda 稀疏器
`PerChannelNormObserver`	计算每个通道的 L2 范数并将其存储在缓冲区中的自定义观察器。

文档