训练¶
训练机器学习模型通常需要自定义训练循环和自定义代码。因此,我们不提供开箱即用的训练循环应用程序。但是,我们有一些关于如何构建训练应用程序以及您可以使用的一般组件来运行自定义训练应用程序的示例。
请参阅
torchx.components
,详细了解如何创作组件有关分布式训练的更多信息,请参阅
torchx.components.dist
。
嵌入式训练脚本¶
对于简单的应用程序,您可以使用 torchx.components.utils.python()
组件将训练脚本嵌入为 Python 命令的命令行参数。这有大小限制,但适用于许多较小的应用程序。
>>> from torchx.components.utils import python
>>> app = """
... import sys
... print(f"Hello, {sys.argv[0]}")
... """
>>> python("TorchX user", c=app)
AppDef(..., entrypoint='python', ...)