使用 TensorDict 预分配内存¶

在本教程中，您将学习如何在 TensorDict 中利用内存预分配。

假设我们有一个返回 TensorDict 的函数

import torch
from tensordict.tensordict import TensorDict


def make_tensordict():
    return TensorDict({"a": torch.rand(3), "b": torch.rand(3, 4)}, [3])

我们可能希望多次调用此函数，并使用结果来填充一个 TensorDict。

N = 10
tensordict = TensorDict({}, batch_size=[N, 3])

for i in range(N):
    tensordict[i] = make_tensordict()

print(tensordict)

TensorDict(
    fields={
        a: Tensor(shape=torch.Size([10, 3]), device=cpu, dtype=torch.float32, is_shared=False),
        b: Tensor(shape=torch.Size([10, 3, 4]), device=cpu, dtype=torch.float32, is_shared=False)},
    batch_size=torch.Size([10, 3]),
    device=None,
    is_shared=False)

由于我们指定了 tensordict 的 batch_size，在循环的第一次迭代中，我们使用第一维大小为 N 的空张量填充 tensordict，其余维度由 make_tensordict 的返回值确定。在上述示例中，我们为键 "a" 预分配了一个大小为 torch.Size([10, 3]) 的零数组，为键 "b" 预分配了一个大小为 torch.Size([10, 3, 4]) 的数组。随后的循环迭代是就地写入的。因此，如果不是所有值都被填充，它们将获得默认值零。

让我们通过逐步执行上述循环来演示正在发生的事情。我们首先初始化一个空的 TensorDict。

N = 10
tensordict = TensorDict({}, batch_size=[N, 3])
print(tensordict)

TensorDict(
    fields={
    },
    batch_size=torch.Size([10, 3]),
    device=None,
    is_shared=False)

第一次迭代后，tensordict 已经预填充了键 "a" 和 "b" 的张量。这些张量包含零，除了我们已赋随机值的第一行。

random_tensordict = make_tensordict()
tensordict[0] = random_tensordict

assert (tensordict[1:] == 0).all()
assert (tensordict[0] == random_tensordict).all()

print(tensordict)

TensorDict(
    fields={
        a: Tensor(shape=torch.Size([10, 3]), device=cpu, dtype=torch.float32, is_shared=False),
        b: Tensor(shape=torch.Size([10, 3, 4]), device=cpu, dtype=torch.float32, is_shared=False)},
    batch_size=torch.Size([10, 3]),
    device=None,
    is_shared=False)

随后的迭代，我们就地更新预分配的张量。

a = tensordict["a"]
random_tensordict = make_tensordict()
tensordict[1] = random_tensordict

# the same tensor is stored under "a", but the values have been updated
assert tensordict["a"] is a
assert (tensordict[:2] != 0).all()

脚本总运行时间： (0 分 0.003 秒)

由 Sphinx-Gallery 生成的图库

使用 TensorDict 预分配内存¶

文档

教程

资源