torch.onnx¶
概述¶
开放神经网络交换 (ONNX) 是一种表示机器学习模型的开放标准格式。 torch.onnx
模块捕获来自原生 PyTorch torch.nn.Module
模型的计算图,并将其转换为 ONNX 图。
导出的模型可以被许多 支持 ONNX 的运行时 使用,包括微软的 ONNX Runtime。
您可以使用两种类型的 ONNX 导出器 API,如下所示。 两者都可以通过函数 torch.onnx.export()
调用。下面的示例演示了如何导出一个简单的模型。
import torch
class MyModel(torch.nn.Module):
def __init__(self):
super(MyModel, self).__init__()
self.conv1 = torch.nn.Conv2d(1, 128, 5)
def forward(self, x):
return torch.relu(self.conv1(x))
input_tensor = torch.rand((1, 1, 128, 128), dtype=torch.float32)
model = MyModel()
torch.onnx.export(
model, # model to export
(input_tensor,), # inputs of the model,
"my_model.onnx", # filename of the ONNX model
input_names=["input"], # Rename inputs for the ONNX model
dynamo=True # True or False to select the exporter to use
)
以下部分介绍了导出器的两个版本。
基于 TorchDynamo 的 ONNX 导出器¶
基于 TorchDynamo 的 ONNX 导出器是 PyTorch 2.1 及更高版本最新的(且为 Beta 版)导出器。
TorchDynamo 引擎用于挂钩到 Python 的帧评估 API,并将其字节码动态重写为 FX 图。生成的 FX 图在最终转换为 ONNX 图之前会被优化。
这种方法的主要优点是 FX 图 是使用字节码分析捕获的,它保留了模型的动态特性,而不是使用传统的静态跟踪技术。
基于 TorchScript 的 ONNX 导出器¶
基于 TorchScript 的 ONNX 导出器自 PyTorch 1.2.0 起可用。
TorchScript 用于跟踪(通过 torch.jit.trace()
)模型并捕获静态计算图。
因此,生成的图有一些限制。
它不记录任何控制流,例如 if 语句或循环;
不处理
training
和eval
模式之间的细微差别;不真正处理动态输入。
为了尝试支持静态跟踪的限制,导出器还支持 TorchScript 脚本(通过 torch.jit.script()
),例如,它增加了对数据相关控制流的支持。但是,TorchScript 本身是 Python 语言的一个子集,因此并非 Python 中的所有功能都受支持,例如就地操作。