Element-wise Addition和Element-wise Multiplication

最新推荐文章于 2026-06-19 07:38:25 发布

原创最新推荐文章于 2026-06-19 07:38:25 发布 · 4.6k 阅读

本内容遵循CC 4.0 BY-SA版权协议

标签

#人工智能

逐元素相加（element-wise addition）和逐元素相乘（element-wise multiplication）对于特征图（feature maps）的空间尺寸和通道数有特定的要求：

对于逐元素相加操作，要求两个特征图的空间尺寸和通道数必须相同。只有这样才能确保每个位置的对应元素可以相加。具体要求如下：

例如，如果有两个特征图 $A$ 和 $B$ ，它们的尺寸必须都为 $\times W \times C$ ，其中 $H$ 是高度， $W$ 是宽度， $C$ 是通道数。这样，逐元素相加后的结果特征图 $C$ 也是 $\times W \times C$ 。

对于逐元素相乘操作，同样要求两个特征图的空间尺寸和通道数必须相同。这样才能确保每个位置的对应元素可以相乘。具体要求如下：

例如，如果有两个特征图 $A$ 和 $B$ ，它们的尺寸必须都为 $\times W \times C$ ，其中 $H$ 是高度， $W$ 是宽度， $C$ 是通道数。这样，逐元素相乘后的结果特征图 $C$ 也是 $\times W \times C$ 。

在BGNet的EFM模块中，这两种操作被用来融合和增强特征：

逐元素相加（⊕）：用于将初始融合特征和输入特征相加，确保在每个位置上同时保留原始特征和融合特征的信息。
```
fei = Conv3x3((fi ⊗ D(fe)) ⊕ fi)
```
逐元素相乘（⊗）：用于将下采样后的边缘特征与输入特征融合，或者将通道注意力权重与特征图融合，以突出重要特征。
```
fei = Conv3x3((fi ⊗ D(fe)) ⊕ fi)
```

假设有两个特征图 $A$ 和 $B$ ，它们的尺寸为 $64 \times 64 \times 128$ ：

对于逐元素相加操作，结果特征图 $C$ 的尺寸仍然是 $64 \times 64 \times 128$ ，其中每个元素 $c_{ijk} = a_{ijk} + b_{ijk}$ 。
对于逐元素相乘操作，结果特征图 $C$ 的尺寸仍然是 $64 \times 64 \times 128$ ，其中每个元素 $cijk=aijk×bijkc_{ijk} = a_{ijk} \times b_{ijk}$ 。