视觉跟踪是计算机视觉应用中最基本的组成部分,尽管近年来该领域已经取得了很大的进步,但是视觉跟踪仍然是一项困难的任务,因为它面临以下挑战,如部分遮挡、形变、光照变化、运动模糊、快速运动、背景杂乱和比例变化等。大多数现有方法可以分为两大类,基于采样的方法或者基于回归的方法。基于采样的方法通过采样大量的目标候选来估计目标状态。虽然这类方法取得了很好的效果,但是其承受着巨大的计算负担。基于回归的方法通常学习一个计算高效的回归函数来直接的预测两帧之间的几何偏移。然而,这类方法大多需要大量的外部视频进行预训练,并且其效果并非十分可观。为了使这两类方法相互促进和增强,我们提出了一个联合采样与回归的目标跟踪框架,如图1所示。其设计了一个新颖的区域建议网络。具体的,我们的方法可以联合考虑有判别力的目标候选生成和结构化的目标回归,进而在一次简单的前向传播中定位目标。在5个流行的目标跟踪数据集上的实验结果表明提出方法具有很好的效果。研究成果发表在国际期刊IEEE T-IP 2019上。
图1. 联合采样与回归的目标跟踪方法