ICCV-2019 SlowFast Networks for Video Recognition

2022-05-02 PaperNote CV 0 0 Comments Word Count: 285(words) Read Count: 1(minutes)

论文地址：SlowFast Networks for Video Recognition

SlowFast：快慢分支视频理解

研究动机来源于人的视觉系统有两种细胞，一个叫p细胞占了80%处理静态图像，一个叫m细胞处理运动信息，发现跟双流有点像，于是也提出了这种一支slow，一支fast这样的网络

慢分支：先用很低的帧率，比如每隔16帧取一帧，这种叫慢分支，学习静态图像，场景信息。因为p细胞占了大部分的数量，而且建模场景信息比较难，所以作者也把大部分参数给了慢分支。简单来说慢分支就是一个大的I3D网络，但是因为帧数不多，所以复杂度也不是很高

快分支：比如4帧取一帧，输入快分支。让这个网络尽可能小，去描述运动信息

later connection：网络间结合起来，互相交互学习时空特征

整个前向过程和网络结构如上

slowfast使用帧数增多，加上non local block后性能也一直在增长

本文链接： https://tyang816.github.io/2022/05/02/SlowFast Networks for Video Recognition/

版权声明： 本博客所有文章除特别声明外，均采用 CC BY 4.0 CN协议许可协议。转载请注明出处！