Struct CompileSpec¶

结构体文档¶

struct CompileSpec¶

Torch-TensorRT TorchScript 编译的设置数据结构

公共函数

TORCHTRT_API CompileSpec(std::vector<std::vector<int64_t>> fixed_sizes)¶

从描述输入张量大小的向量构造新的 Compile Spec 对象。用于设置固定输入大小的便捷构造函数。向量中的每个条目代表一个输入，应按调用顺序提供。

在所有输入均为静态大小且您可以使用默认输入数据类型和格式（对于 FP32 和 INT8 权重使用 FP32，对于 FP16 权重使用 FP16，contiguous）的情况下，应使用此构造函数作为便捷方式。

TORCHTRT_API CompileSpec(std::vector<c10::ArrayRef<int64_t>> fixed_sizes)¶

从 c10::ArrayRef (tensor.sizes() 的输出) 描述输入张量大小构造新的 Compile Spec 对象。用于设置固定输入大小的便捷构造函数。向量中的每个条目代表一个输入，应按调用顺序提供。

在所有输入均为静态大小且您可以使用默认输入数据类型和格式（对于 FP32 和 INT8 权重使用 FP32，对于 FP16 权重使用 FP16，contiguous）的情况下，应使用此构造函数作为便捷方式。

TORCHTRT_API CompileSpec(std::vector<Input> inputs)¶

从输入范围构造新的 Compile Spec 对象。向量中的每个条目代表一个输入，应按调用顺序提供。

使用此构造函数定义具有动态形状、特定输入类型或张量格式的输入

TORCHTRT_API CompileSpec(torch::jit::IValue input_signature)¶

从表示模块输入张量嵌套的 IValue 构造新的 Compile Spec 对象。

公共成员

std::set<DataType> enabled_precisions = {DataType::kFloat}¶: TensorRT 在编译期间允许用于内核的精度集。

bool disable_tf32 = false¶

阻止 Float32 层使用 TF32 数据格式

TF32 通过在乘法前将输入四舍五入到 10 位尾数来计算内积，但使用 23 位尾数累积总和。这是 FP32 层默认的行为。

EngineCapability capability = EngineCapability::kSTANDARD ¶: 设置引擎的限制 (CUDA 安全)

bool require_full_compilation = false¶: 要求完整模块编译到 TensorRT，而不是可能在 PyTorch 中运行不支持的操作

std::vector<std::string> torch_executed_ops¶: 必须在 PyTorch 中运行的 aten 操作符列表。如果此列表不为空但 require_full_compilation 为 True，则会抛出错误。

std::vector<std::string> torch_executed_modules¶: 必须在 PyTorch 中运行的模块列表。如果此列表不为空但 require_full_compilation 为 True，则会抛出错误。