NIPS-2020 BYOL works even without batch statistics 2022-01-24 PaperNote CV, cs.ContraLern 0 0 Comments Word Count: 167(words) Read Count: 1(minutes) 论文地址:BYOL works even without batch statistics BYOL v2:回应 Batch Norm不只是BYOL的创新性 通过大量消融实验找到特例与解释。当simCLR不用在projector和编码器中用batch norm的时候simCLR也失败了,说明当不用归一化的时候,不光BYOL,simCLR也不行,用了负样本也训练不出来,这就证明了batch norm不是提供了一个隐式的负样本。 最后达成的结论是batch norm主要是帮助模型稳定的训练从而使模型不会坍塌。以及说明如果一开始模型初始化就比较好,那么离开了batch norm也没有问题