Home

Rotate to Attend: Convolutional Triplet Attention Module

这是一篇发表在 WACV2021 上的文章,初读下来其实就是作者想方设法地想将 channels 和其他通道(spatial location or temporal channel)进行融合来使得信息进行交互、相融。 Abstract 之前的图像领域 cv 算法已相当饱和了,通过在 spatial location 或是 channels 进行单独 attention 操作,使得准确度又有了一波提升。那么作者就突发奇想了,我能不能做一种 cross-dimension interaction,通过这种跨纬度的 attention 使得模型更优化呢? 对于一个输入,首先通过 risidual transformation 操作使其进行旋转(其实就是一个 permute),然后通过...

Read more