2023年12月,研究组博士生涂耿以及硕士生李江南/博士生张义策撰写的两篇论文获AAAI 2024录用。AAAI全称Association for the Advancement of Artificial Intelligence,在中国计算机学会推荐会议列表中被列为A类会议。会议将于2024年2月20-27日在加拿大温哥华召开。
标题:Adaptive Graph Learning for Multimodal Conversational Emotion Detection
作者:涂耿,谢甜,梁斌,王鸿鹏*,徐睿峰*
简介:多模态对话情绪识别旨在根据多模态对话语境判别出目标话语所表达的情绪类别,是构建共情对话系统的基础任务。现有方法在处理单模态交互时面临着平衡说话人内部和说话人之间上下文依赖的挑战。这种平衡至关重要,因为它涉及对自身依赖性(情绪惯性)和对他人依赖性(共情)的建模。前者是说话者自身的情绪如何影响他们,而后者则是对方的情绪如何影响说话者。此外,在处理涉及不同模态之间存在情绪冲突的内容时,还存在跨模态交互的挑战。为解决上述问题,论文引入了一种自适应交互图网络(AdaIGN),通过使用Gumbel Softmax自适应地选择节点和边,增强了模态内部和跨模态的交互。与无向图不同,论文使用有向的IGN来防止未来的话语影响当前的话语。接下来,提出了节点级和边级选择策略(NESP),以指导节点和边的选择,以及图级选择策略(GSP),用于整合原始IGN和NESP增强的IGN中的话语表示。此外,还设计了一个任务特定的损失函数,优先考虑文本模态和说话人内部上下文的选择。为了降低计算复杂性,采用通过自监督方法获取的伪标签,以筛选出部分特定的话语进行选择。实验结果表明,AdaIGN在两个公共数据集上的性能优于强基线。
标题:Enhancing Multi-Label Classification via Dynamic Label-Order Learning
作者:李江南#,张义策#,陈诗炜,徐睿峰
简介:现有的生成式多标签分类方法使用自回归的方式生成标签序列。实验表明标签间的顺序对模型的学习和推理有显著影响,因此如何妥善地确定标签顺序是这类方法的一个关键问题。以往的工作往往根据字母序、标签频率或共现频率等方法来确定标签顺序。然而,这种静态方法为所有样本分配了统一的标签顺序,导致忽略了每个样本的独特语义。更重要的是,这些方法会导致模型僵化地记忆训练时的顺序,从而在推理过程中容易出现标签遗漏的情况。基于上述问题,本文提出了一种动态的标签顺序学习方法,它自适应地学习每个样本的标签顺序。具体来说,该方法采用难度优先原则,根据样本的语义迭代地估计标签的难度并据此构建标签序列。为了降低标签顺序学习带来的额外成本,使用同一个生成模型来进行标签顺序的学习和多标签分类的建模,并引入了一个统一的损失函数来进行优化。在公共数据集上进行的大量实验结果和分析显示了该方法的有效性和通用性。