背景
研究生牛泰裕、熊峰论文获ICME 2025录用
2025-05-19 10:50 HITSZ-HLT    (浏览量)

20253月,研究团队牛泰裕、熊峰同学的两篇论文被计算机图形学与多媒体重要国际会议ICME 2025录用。ICME会议全称为IEEE International Conference on Multimedia & Expo。在中国计算机学会推荐会议列表中被列为B类会议。会议将于2025630-74日在法国南特召开。

题目:Multimodal Emotion Recognition in Conversations via Graph Structure Learning

作者:Feng Xiong, Geng Tu, Yice Zhang, Jun Wang, Shiwei Chen, Bin Liang, Yue Yu, Min Yang, Ruifeng Xu*

简介:多模态情感识别对话(MERC)目的是检测对话视频中每个发言中所蕴含的情感。由于在建模说话者敏感性和上下文敏感性依赖关系方面的优势,图结构方法在相关研究中获得广泛应用。现有的图结构方法存在结构冗余使得模型在聚合无关噪声信息时受到负担,以及连接不足导致缺乏跨模态的上下文线索等不足。为了解决上述问题,论文提出了一种图结构学习框架用于多模态情感识别对话。该框架包含两个关键组件:上下文感知图稀疏化(CGS)和隐式图关系挖掘(IGR)。其中CGS通过一个边选择网络来优化基于人工经验预定义的图,过滤掉由结构冗余引起的噪声信息。IGR则探索对情感推理有益的潜在连接。基于两个数据集的实验结果表明,论文提出的框架显著提升了图结构学习方法在MERC任务中的表现。


图片


题目:A Multi-stage and Multi-target Knowledge Distillation Framework for Multimodal Conversational Emotion Recognition

类别:ICME 2025

作者:Taiyu NiuGeng TuHui WangBing QinRuifeng Xu

在对话情绪识别(ERC)任务中,单标签独热编码(one-hot)通常被用作真实标签,但这种方法可能无法全面捕捉语句中传递的所有情感。近期的ERC研究探索了通过单实例生成软标签的自蒸馏技术,旨在提升情感理解能力。然而,这些方法仍难以完整捕捉复杂的情绪表达。而在多模态ERCMERC)中,由于需要整合可能表达不同情感的多种模态信息,生成软标签的挑战性更为突出。为此,本文提出了一种多阶段多目标知识蒸馏框架。该框架包含两大核心组件:多阶段蒸馏(MSD)和多目标蒸馏(MTD)。其中MSD专注于对软标签和语句表征进行多阶段自蒸馏,促使MERC模型在分阶段优化标签预测。在MSD基础上,MTD进一步从特征提取器中蒸馏软标签和特征(该提取器用于获取模态共有特征和模态特有特征),从而深化模型对多模态场景下情感的理解。在两个数据集上的实验结果表明,论文提出的框架显著提升了多种MERC模型的性能,超越了现有最优方法。


图片
审稿:徐睿峰
校正:王   丹




打印    收藏
关闭窗口

Return Top