李菊, 钱立星
电脑与电信. 2025, 1(5): 16-21.
面部表情在情感计算、人机交互、智能监控等领域具有重要价值。现有表情识别方法多集中于空间域,通过卷积神经网络提取特征,但难以同时兼顾全局结构信息和局部细节特征。同时,提升性能通常伴随着计算开销的增加,限制了其在实际应用中的广泛性。近年来,频域方法因其在特征分离、去噪能力以及全局信息提取方面的优势受到关注,但单一的频域特征提取方案通常难以全面捕获表情图像信息。针对这些问题,提出了一种基于频域低通滤波与Gabor特征融合的多通道人脸表情识别方法,通过多通道融合机制,将低通滤波提取的全局结构信息与Gabor滤波提取的细节信息相结合,在保持新增网络开销微小(新增参数仅为0.02 MB)的同时提升了识别性能。在公开的人脸表情识别数据集FER2013和RAF-DB上,该方法的准确率分别提升了0.78%和1.86%。实验结果表明,该方法有效弥补了传统方法的局限性,并在几乎不增加网络计算开销的前提下使识别准确率有一定的提升,为实际应用提供了一种解决方案。