• 文档 >
  • 编写 Dynamo 转换器
快捷方式

编写 Dynamo 转换器

Torch-TensorRT 中的 dynamo 转换器库位于 TensorRT/py/torch_tensorrt/dynamo/conversion 中。

转换器实现

注册

转换器是一个使用 torch_tensorrt.dynamo.dynamo_tensorrt_converter 装饰的函数,遵循函数签名

@torch_tensorrt.dynamo.conversion.dynamo_tensorrt_converter(torch.ops.aten.leaky_relu.default)
def leaky_relu_converter(
    ctx: torch_tensorrt.dynamo.conversion.ConversionCtx,
    target: Target,
    args: Tuple[Argument, ...],
    kwargs: Dict[str, Argument],
    name: str,
) -> Union[tensorrt.ITensor, Sequence[tensorrt.ITensor]]:

装饰器带有多个参数

  • key:为其实现转换器的节点目标(例如,torch.ops.aten.leaky_relu.default)

  • enabled:转换器是否应启用为可在转换器注册表中使用的转换器

  • capability_validator:一个 lambda,可以接收 torch.fx.Node 并确定转换器是否可以正确处理此节点。如果验证器返回 False,则子图分区器将确保此节点在编译图中以 PyTorch 方式运行。

  • priority:允许开发人员覆盖转换器注册表中的现有转换器

转换器只需要 key。

函数体负责获取网络的当前状态,并添加下一个子图以使用 TensorRT 操作执行装饰器中指定的 op。该函数提供的参数与原生 PyTorch op 提供的参数相同,但添加了冻结张量属性的 numpy 数组或 TensorRT ITensor 的情况,它们是先前节点的输出张量,对应于图中中间操作的边/输出张量。要确定预期的类型以及转换器的返回类型,请查看正在转换的操作的定义。对于 aten 操作,此文件将是真相来源:https://github.com/pytorch/pytorch/blob/main/aten/src/ATen/native/native_functions.yaml 由于开发人员可能编写的许多转换器都是较低级别操作符的组合,因此无需以原始 TensorRT 实现转换器,torch_tensorrt.dynamo.conversion.impl 子包包含许多操作的实现,这些操作可以链接以创建 TensorRT 子图。

  • ctx:编译器的当前状态。转换器主要会操作 ctx.net,它是正在构建的 tensorrt.INetworkDefinition。此结构中还提供了其他元数据,包括用户提供的设置。

  • target:上面 call_modulecall_function 中的目标键。例如:torch.ops.aten_.leaky_relu.default。请注意,torch.ops.aten._leaky_reluOpOverloadPacket,而 torch.ops.aten_.leaky_relu.defaultOpOverload

  • args:传递给特定节点的参数(由 torch_tensorrt.dynamo.conversion.TRTInterpreter 收集)。这些参数以及 kwargs 用于构造表示 INetworkDefinition 中当前节点的特定 TensorRT 子图。

  • kwargs:传递给特定节点的参数(由 torch_tensorrt.dynamo.conversion.TRTInterpreter 收集)。

  • name:包含目标名称的字符串

该函数应返回 tensorrt.ITensor 或一些 tensorrt.ITensor 的集合,以便在 torch_tensorrt.dynamo.conversion.TRTInterpreter 中使用,以匹配正在转换的操作的输出签名

功能验证

有些转换器需要考虑特殊情况。在这些情况下,应使用 capability_validators 使用 @dynamo_tensorrt_converter 注册转换器。我们通过 torch.ops.aten.embedding.default 说明这一点。它具有参数 - scale_grad_by_freqsparse,当前实现不支持这些参数。在这种情况下,我们可以编写验证器 embedding_param_validator,它实现给定这些参数转换器不受支持,并通过以下方式注册转换器

类型契约

该函数预期遵循签名所建立的类型契约。这包括接受有效 PyTorch 类型 + numpy 数组(用于常量张量)和 TensorRT ITensor 的联合。如果转换器仅支持类型的子集,您还可以添加 torch_tensorrt.dynamo.conversion.converter_utils.enforce_tensor_types,它允许您指定一个字典,用于映射输入位置和这些输入可以采用的类型。在可能的情况下,装饰器将转换输入以匹配这些类型,并优先考虑提供的顺序。int 键将引用 args 中的位置参数。str 键将引用 kwargs 中的关键字参数。

示例:Convolution

默认的卷积转换器同时使用功能验证器和类型强制来防止在不支持的情况下运行。功能验证器在分区期间运行,以确定特定的卷积节点是否可以转换为 TensorRT 或者需要在 PyTorch 中运行。在这里,验证器确保卷积不超过 3D。类型强制器将在调用转换器之前自动转换输入到转换器中支持的类型,从而限制了作者必须处理的情况数量。

@dynamo_tensorrt_converter(
    torch.ops.aten.convolution.default, capability_validator=lambda conv_node: conv_node.args[7] in ([0], [0, 0], [0, 0, 0])
)  # type: ignore[misc]
@enforce_tensor_types(
    {
        0: (TRTTensor,),
        1: (np.ndarray, torch.Tensor, TRTTensor),
        2: (np.ndarray, torch.Tensor, TRTTensor),
    }
)  # type: ignore[misc]
def aten_ops_convolution(
    ctx: ConversionContext,
    target: Target,
    args: Tuple[Argument, ...],
    kwargs: Dict[str, Argument],
    name: str,
) -> Union[TRTTensor, Sequence[TRTTensor]]:

评估器

某些操作不会产生 TensorRT 子图作为副作用。这些被称为评估器。

示例:operator.getitem

评估器之所以如此分类,是因为它们不会对图进行任何修改。这在 py/torch_tensorrt/dynamo/conversion/op_evaluators.py 中实现,并带有相应的 capbility_validator。操作码是 operator.getitem

算子分解

有些转换器可以分解成 PyTorch 中的子操作,并且不需要单独的转换器注册。此类转换器可以通过分解来实现。

示例:addmm

分解通过 register_torch_trt_decomposition 装饰器注册。我们定义 addmm_replacement 并将其替换为 torch 操作,这些操作将调用其相应的转换器。

@torch_tensorrt.dynamo.lowering.register_torch_trt_decomposition(torch.ops.aten.addmm)
def addmm_replacement(
    input_: torch.Tensor, mat1: torch.Tensor, mat2: torch.Tensor, *, beta=1, alpha=1
) -> torch.Tensor:
    return torch.add(
        torch.mul(input_, beta), torch.mul(torch.matmul(mat1, mat2), alpha)
    )

您可以通过编辑 torch_tensorrt.dynamo.lowering.torch_enabled_decompositionstorch_tensorrt.dynamo.lowering.torch_disabled_decompositions 来修改运行的分解。

注意:torch_tensorrt.dynamo.lowering.torch_enabled_decompositionstorch_tensorrt.dynamo.lowering.torch_disabled_decompositions 必须是不相交的集合,并且 torch_tensorrt.dynamo.lowering 中已定义的分解将优先于 torch 降级操作。

很多时候,这比实现转换器要容易得多。因此,在可能的情况下,这应该是首先尝试的方法。

文档

获取 PyTorch 的全面开发者文档

查看文档

教程

获取针对初学者和高级开发人员的深入教程

查看教程

资源

查找开发资源并获得问题的解答

查看资源