注意
转到 末尾 下载完整的示例代码。
使用 TensorDict 预分配内存¶
作者:Tom Begley
在本教程中,您将学习如何在 TensorDict
中利用内存预分配。
假设我们有一个返回 TensorDict
的函数
import torch
from tensordict.tensordict import TensorDict
def make_tensordict():
return TensorDict({"a": torch.rand(3), "b": torch.rand(3, 4)}, [3])
我们可能希望多次调用此函数,并使用结果来填充一个 TensorDict
。
TensorDict(
fields={
a: Tensor(shape=torch.Size([10, 3]), device=cpu, dtype=torch.float32, is_shared=False),
b: Tensor(shape=torch.Size([10, 3, 4]), device=cpu, dtype=torch.float32, is_shared=False)},
batch_size=torch.Size([10, 3]),
device=None,
is_shared=False)
由于我们指定了 tensordict 的 batch_size
,在循环的第一次迭代中,我们使用第一维大小为 N
的空张量填充 tensordict,其余维度由 make_tensordict
的返回值确定。在上述示例中,我们为键 "a"
预分配了一个大小为 torch.Size([10, 3])
的零数组,为键 "b"
预分配了一个大小为 torch.Size([10, 3, 4])
的数组。随后的循环迭代是就地写入的。因此,如果不是所有值都被填充,它们将获得默认值零。
让我们通过逐步执行上述循环来演示正在发生的事情。我们首先初始化一个空的 TensorDict
。
N = 10
tensordict = TensorDict({}, batch_size=[N, 3])
print(tensordict)
TensorDict(
fields={
},
batch_size=torch.Size([10, 3]),
device=None,
is_shared=False)
第一次迭代后,tensordict 已经预填充了键 "a"
和 "b"
的张量。这些张量包含零,除了我们已赋随机值的第一行。
random_tensordict = make_tensordict()
tensordict[0] = random_tensordict
assert (tensordict[1:] == 0).all()
assert (tensordict[0] == random_tensordict).all()
print(tensordict)
TensorDict(
fields={
a: Tensor(shape=torch.Size([10, 3]), device=cpu, dtype=torch.float32, is_shared=False),
b: Tensor(shape=torch.Size([10, 3, 4]), device=cpu, dtype=torch.float32, is_shared=False)},
batch_size=torch.Size([10, 3]),
device=None,
is_shared=False)
随后的迭代,我们就地更新预分配的张量。
脚本总运行时间: (0 分 0.003 秒)