torch.bucketize¶
- torch.bucketize(input, boundaries, *, out_int32=False, right=False, out=None) Tensor ¶
返回
input
中每个值的所属桶的索引,其中桶的边界由boundaries
设置。返回一个与input
大小相同的新的张量。如果right
为 False(默认),则左边界是开放的。请注意,此行为与 numpy.digitize 的行为相反。更正式地说,返回的索引满足以下规则right
返回的索引满足
False
boundaries[i-1] < input[m][n]...[l][x] <= boundaries[i]
True
boundaries[i-1] <= input[m][n]...[l][x] < boundaries[i]
- 参数
- 关键字参数
out_int32 (bool, 可选) – 指示输出数据类型。如果为 True,则为 torch.int32,否则为 torch.int64。默认值为 False,即默认输出数据类型为 torch.int64。
right (bool, 可选) – 如果为 False,则返回找到的第一个合适位置。如果为 True,则返回最后一个索引。如果没有找到合适的索引,则返回 0(对于非数值值(例如 nan、inf))或
boundaries
的大小(最后一个索引之后的一个)。换句话说,如果为 False,则从boundaries
中获取input
中每个值的较低边界索引。如果为 True,则获取上限索引。默认值为 False。out (Tensor, 可选) – 输出张量,如果提供,则必须与
input
大小相同。
示例
>>> boundaries = torch.tensor([1, 3, 5, 7, 9]) >>> boundaries tensor([1, 3, 5, 7, 9]) >>> v = torch.tensor([[3, 6, 9], [3, 6, 9]]) >>> v tensor([[3, 6, 9], [3, 6, 9]]) >>> torch.bucketize(v, boundaries) tensor([[1, 3, 4], [1, 3, 4]]) >>> torch.bucketize(v, boundaries, right=True) tensor([[2, 3, 5], [2, 3, 5]])