快捷方式

张量视图

PyTorch 允许张量作为现有张量的视图存在。视图张量与其基础张量共享相同的底层数据。支持视图避免了显式数据复制,从而使我们能够进行快速且内存高效的重塑、切片和逐元素操作。

例如,要获取现有张量 t 的视图,可以调用 t.view(...)

>>> t = torch.rand(4, 4)
>>> b = t.view(2, 8)
>>> t.storage().data_ptr() == b.storage().data_ptr()  # `t` and `b` share the same underlying data.
True
# Modifying view tensor changes base tensor as well.
>>> b[0][0] = 3.14
>>> t[0][0]
tensor(3.14)

由于视图与其基础张量共享底层数据,因此,如果编辑视图中的数据,基础张量也会反映出来。

通常,PyTorch 运算会返回一个新的张量作为输出,例如 add()。但在视图运算的情况下,输出是输入张量的视图,以避免不必要的数据复制。创建视图时不会发生数据移动,视图张量只是改变了它解释相同数据的方式。获取连续张量的视图可能会产生非连续张量。用户应格外注意,因为连续性可能会对性能产生隐式影响。 transpose() 是一个常见的例子。

>>> base = torch.tensor([[0, 1],[2, 3]])
>>> base.is_contiguous()
True
>>> t = base.transpose(0, 1)  # `t` is a view of `base`. No data movement happened here.
# View tensors might be non-contiguous.
>>> t.is_contiguous()
False
# To get a contiguous tensor, call `.contiguous()` to enforce
# copying data when `t` is not contiguous.
>>> c = t.contiguous()

作为参考,以下是 PyTorch 中视图运算的完整列表

注意

在通过索引访问张量的内容时,PyTorch 遵循 Numpy 的行为,即基本索引返回视图,而高级索引返回副本。通过基本索引或高级索引进行的赋值都是原地操作。有关更多示例,请参阅 Numpy 索引文档

还有一些运算具有特殊行为,值得一提

  • reshape()reshape_as()flatten() 可以返回视图或新的张量,用户代码不应依赖于它是视图还是非视图。

  • 如果输入张量已经连续,contiguous() 会返回**自身**,否则,它会通过复制数据返回一个新的连续张量。

有关 PyTorch 内部实现的更详细介绍,请参阅 ezyang 关于 PyTorch 内部结构的博客文章

文档

访问 PyTorch 的全面开发者文档

查看文档

教程

获取针对初学者和高级开发者的深入教程

查看教程

资源

查找开发资源并获得问题的解答

查看资源