• 文档 >
  • 在 ExecuTorch 中分析模型
快捷方式

在 ExecuTorch 中分析模型

在 ExecuTorch 中分析使用户能够访问这些运行时指标

  • 模型加载时间。

  • 运算符级执行时间。

  • 委托执行时间。

    • 如果用户调用的委托已与 开发者工具 集成,那么用户还可以访问委托的运算符执行时间。

  • 端到端推理执行时间。

ExecuTorch 分析的一个独特方面是能够将每个运行时执行的运算符链接回生成此运算符的确切 Python 代码行。此功能使用户能够轻松识别模型中的热点,将其源代码回溯到确切的 Python 代码行,并在选择时进行优化。

我们通过 Python 检查器 API 提供对所有分析数据的访问权限。上述数据可以通过这些接口访问,使用户能够执行他们选择的任何后运行分析。

在 ExecuTorch 中分析模型的步骤

  1. [可选] 在导出模型时生成 ETRecord。如果提供,这将使用户能够将分析详细信息链接回热心模型源代码(包含堆栈跟踪和模块层次结构)。

  2. 使用启用分析的预处理器标志构建运行时。详细说明在 ETDump 文档 中。

  3. 在 ExecuTorch 运行时上运行您的程序并生成 ETDump

  4. 通过将您从运行时获得的 ETDump 与步骤 1 中可选生成的 ETRecord 一起传递,创建 检查器 API 的实例。

    • 通过检查器 API,用户可以进行广泛的分析,从打印性能详细信息到对模块级进行更精细的粒度计算。

有关上述过程在示例模型上的分步演练,请参考 开发者工具教程

文档

访问 PyTorch 的全面开发者文档

查看文档

教程

获取面向初学者和高级开发人员的深入教程

查看教程

资源

查找开发资源并获得问题的解答

查看资源