快捷方式

LazyMemmapStorage

class torchrl.data.replay_buffers.LazyMemmapStorage(max_size: int, *, scratch_dir=None, device: device = 'cpu', ndim: int = 1)[源代码]

张量和张量字典的内存映射存储。

参数:
  • max_size (int) – 存储的大小,即缓冲区中存储元素的最大数量。

  • scratch_dir (strpath) – 将 memmap 张量写入的目录。

  • device (torch.device, 可选) – 采样张量将存储和发送到的设备。默认为 torch.device("cpu")。如果提供 None,则会自动从传递的第一批数据中收集设备。默认情况下不启用此功能,以避免数据错误地放置在 GPU 上,从而导致 OOM 问题。

  • ndim (int, 可选) – 用于测量存储大小时要考虑的维数。例如,形状为 [3, 4] 的存储,如果 ndim=1,则容量为 3,如果 ndim=2,则容量为 12。默认为 1

示例

>>> data = TensorDict({
...     "some data": torch.randn(10, 11),
...     ("some", "nested", "data"): torch.randn(10, 11, 12),
... }, batch_size=[10, 11])
>>> storage = LazyMemmapStorage(100)
>>> storage.set(range(10), data)
>>> len(storage)  # only the first dimension is considered as indexable
10
>>> storage.get(0)
TensorDict(
    fields={
        some data: MemoryMappedTensor(shape=torch.Size([11]), device=cpu, dtype=torch.float32, is_shared=False),
        some: TensorDict(
            fields={
                nested: TensorDict(
                    fields={
                        data: MemoryMappedTensor(shape=torch.Size([11, 12]), device=cpu, dtype=torch.float32, is_shared=False)},
                    batch_size=torch.Size([11]),
                    device=cpu,
                    is_shared=False)},
            batch_size=torch.Size([11]),
            device=cpu,
            is_shared=False)},
    batch_size=torch.Size([11]),
    device=cpu,
    is_shared=False)

此类还支持张量类数据。

示例

>>> from tensordict import tensorclass
>>> @tensorclass
... class MyClass:
...     foo: torch.Tensor
...     bar: torch.Tensor
>>> data = MyClass(foo=torch.randn(10, 11), bar=torch.randn(10, 11, 12), batch_size=[10, 11])
>>> storage = LazyMemmapStorage(10)
>>> storage.set(range(10), data)
>>> storage.get(0)
MyClass(
    bar=MemoryMappedTensor(shape=torch.Size([11, 12]), device=cpu, dtype=torch.float32, is_shared=False),
    foo=MemoryMappedTensor(shape=torch.Size([11]), device=cpu, dtype=torch.float32, is_shared=False),
    batch_size=torch.Size([11]),
    device=cpu,
    is_shared=False)
attach(buffer: Any) None

此函数将采样器附加到此存储。

从该存储读取的缓冲区必须通过调用此方法作为附加实体包含在内。这保证了当存储中的数据发生更改时,即使存储与其他缓冲区共享(例如优先采样器),组件也会意识到这些更改。

参数:

buffer – 从该存储读取的对象。

dump(*args, **kwargs)

dumps() 的别名。

load(*args, **kwargs)

loads() 的别名。

save(*args, **kwargs)

dumps() 的别名。

文档

访问 PyTorch 的全面开发者文档

查看文档

教程

获取针对初学者和高级开发人员的深入教程

查看教程

资源

查找开发资源并解答您的问题

查看资源