地方门户网站的特点,天元建设集团有限公司第四建筑工程公司,北京官网seo推广,360网站建设公司哪家好前言
torch.gather在目前基于 transformer or query based 的目标检测中#xff0c;在最后获取目标结果时#xff0c;经常用到。
这里记录下用法#xff0c;防止之后又忘了。
介绍
torch.gather 官方文档对torch.gather()的定义非常简洁
定义#xff1a;从原tensor中获…前言
torch.gather在目前基于 transformer or query based 的目标检测中在最后获取目标结果时经常用到。
这里记录下用法防止之后又忘了。
介绍
torch.gather 官方文档对torch.gather()的定义非常简洁
定义从原tensor中获取指定dim和指定index的数据 看到这个核心定义我们很容易想到gather()的基本想法其实就类似从完整数据中按索引取值般简单比如下面从列表中按索引取值
lst [1, 2, 3, 4, 5]
value lst[2] # value 3
value lst[2:4] # value [3, 4]上面的取值例子是取单个值或具有逻辑顺序序列的例子而对于深度学习常用的批量tensor数据来说我们的需求可能是选取其中多个且乱序的值此时gather()就是一个很好的tool它可以帮助我们从批量tensor中取出指定乱序索引下的数据因此其用途如下
用途方便从批量tensor中获取指定索引下的数据该索引是高度自定义化的可乱序的
示例
我们找个3x3的二维矩阵做个实验
import torchtensor_0 torch.arange(3, 12).view(3, 3)
print(tensor_0)输出结果
tensor([[ 3, 4, 5],[ 6, 7, 8],[ 9, 10, 11]])2.1 输入行向量index并替换行索引(dim0)
index torch.tensor([[2, 1, 0]])
tensor_1 tensor_0.gather(0, index)
print(tensor_1)输出结果
tensor([[9, 7, 5]])过程如图所示
2.2 输入行向量index并替换列索引(dim1)
index torch.tensor([[2, 1, 0]])
tensor_1 tensor_0.gather(1, index)
print(tensor_1)输出结果
tensor([[5, 4, 3]])过程如图所示
2.3 输入列向量index并替换列索引(dim1)
index torch.tensor([[2, 1, 0]]).t()
tensor_1 tensor_0.gather(1, index)
print(tensor_1)输出结果
tensor([[5],[7],[9]])过程如图所示
scatter
基本是 gather 的反过程是将数据添加进去 dochttps://pytorch.org/docs/stable/generated/torch.Tensor.scatter_.html#torch.Tensor.scatter_
self[index[i][j][k]][j][k] src[i][j][k] # if dim 0
self[i][index[i][j][k]][k] src[i][j][k] # if dim 1
self[i][j][index[i][j][k]] src[i][j][k] # if dim 2example src torch.arange(1, 11).reshape((2, 5))src
tensor([[ 1, 2, 3, 4, 5],[ 6, 7, 8, 9, 10]])index torch.tensor([[0, 1, 2, 0]])torch.zeros(3, 5, dtypesrc.dtype).scatter_(0, index, src)
tensor([[1, 0, 0, 4, 0],[0, 2, 0, 0, 0],[0, 0, 3, 0, 0]])index torch.tensor([[0, 1, 2], [0, 1, 4]])torch.zeros(3, 5, dtypesrc.dtype).scatter_(1, index, src)
tensor([[1, 2, 3, 0, 0],[6, 7, 0, 0, 8],[0, 0, 0, 0, 0]]) torch.full((2, 4), 2.).scatter_(1, torch.tensor([[2], [3]]),
... 1.23, reducemultiply)
tensor([[2.0000, 2.0000, 2.4600, 2.0000],[2.0000, 2.0000, 2.0000, 2.4600]])torch.full((2, 4), 2.).scatter_(1, torch.tensor([[2], [3]]),
... 1.23, reduceadd)
tensor([[2.0000, 2.0000, 3.2300, 2.0000],[2.0000, 2.0000, 2.0000, 3.2300]])具体过程见 gather 的就好~一摸一样一个获取一个填入。