自然场景中的人脸表情识别是人机交互的重要目标之一,然而目前大部分人脸表情识别系统多是基于实验室场景下的人脸表情数据完成的。相较于实验室场景下的人脸表情数据,自然场景下的人脸表情图像通常伴随着光照变化大,姿态更多样,人脸遮挡严重等问题,这显然会导致传统人脸表情识别方法无法在自然场景下的数据上得到好的识别效果。随着深度学习的出现,为人脸表情识别提供了新的思路和方法,然而基于深度学习的方法通常需要海量数据的支持,这在目前自然场景下的人脸表情数据中是无法得到满足的,且数据标注又是一件非常费事耗力的事情。为了解决上述问题,我们提出基于循环生成对抗网络的自然场景下人脸表情图像生成以及表情识别的新方法,如图1所示。所提方法基于一种无监督的生成对抗网络方式,可借助于网络上大量无标签的人脸数据,合成实验室场景下带标签数据所对应的自然场景下带标签数据。从而大大地扩充了自然场景下的带标签人脸表情数据,可以更好的训练深度学习模型。其次,通过注意力迁移机制,使得由实验室场景下人脸表情数据训练的识别模型可以用来促进自然场景下的表情识别模型的训练,从而进一步提高自然场景下人脸表情识别率。通过循环生成对抗网络中的循环损失,保证了实验室场景下人脸表情数据转变到自然场景下人脸图像时情感信息的一致性。所提模型可以方便的借助网络上大量的无标签人脸数据,从而避免了数据标注所带来的麻烦,且在自然场景下的人脸表情识别任务上取得了不错的效果。研究成果发表在多媒体领域顶级会议ACM Multimedia 2018上。
图1.基于循环一致性对抗注意力迁移表示学习的表情识别