论文地址:Unsupervised Learning of Visual Features by Contrasting Cluster Assignments
SwAV:对比学习+聚类,借助先验不和大量负样本比,跟聚类中心比
-
聚类的相关工作有:deep cluster等,留待看
-
相较于上万的负样本,与3000个聚类中心比更小
2.1 前向过程 $x_1$ 数据增强得到 $x_1,x_2$;通过编码器得到 $z_1,z_2$;$z$ 和聚类中心 $c$ 通过clustering方法生成目标 $q_1,q_2$ ;$z_1,z_2$ 相似,按道理可以互相作预测,即 $z_1 \cdot c$ 可以去预测 $q_2$ ,反之亦然
-
聚类中心有明确的语义含义,而先前抽取的有的负样本还可能是正样本,也可能类别不均衡不够有效
-
新的正样本提取方法(Multi-crop),增加view的情况下尽可能减少计算量
4.1 方法 原本是从256x256的图片裁剪出2张224x224的图片,改为裁剪出2x160+4x96合计6张图片。因为原本的裁剪方法更多是关注于整体特征,这样可以关注整体+局部特征,效果更好,提点明显,也比较通用