快捷方式

torchao.sparsity

sparsify_

使用 apply_tensor_subclass 转换模型中线性模块的权重。

semi_sparse_weight

将线性模块的权重转换为半结构化 (2:4) 稀疏性

int8_dynamic_activation_int8_semi_sparse_weight

将 int8 动态对称逐 token 激活和 int8 逐通道权重量化 + 2:4 稀疏性应用于线性层。

apply_fake_sparsity

此函数在模型中的所有线性层上模拟 2:4 稀疏性。

WandaSparsifier

Wanda 稀疏器

PerChannelNormObserver

计算每个通道的 L2 范数并将其存储在缓冲区中的自定义观察器。

文档

查阅 PyTorch 的全面开发者文档

查看文档

教程

获取面向初学者和高级开发者的深入教程

查看教程

资源

查找开发资源并获得问题解答

查看资源