第十三届全国社会媒体处理大会(CIPS-SMP 2025)于2025年11月20日至23日在湖北武汉举行。会议由中国中文信息学会社会媒体处理专委会主办、华中科技大学计算机科学与技术学院承办,汇聚全国各地1069位专家、学者以及190多家单位,共同聚焦大模型与人类发展的深度融合,共同探索大模型赋能人类社会可持续发展的路径。
大会设立海报交流环节,邀请国际顶级期刊和会议的论文作者与参会代表面对面交流。来自HLT研究团队的博士生王冰冰展示了其关于立场检测工作的最新成果,并荣获“亮点海报奖”。
海报题目:Stance Detection in Social Media
作者:Bingbing Wang, Zhixin Bai, Jingjie Lin, Zhengda Jin, Jing Li, Ruifeng Xu
论文来源:
Bingbing Wang*, Jingjie Lin*, Zhixin Bai, Xintong Song, Qianlong Wang, Min Yang, Xi Zeng, Jing Li, and Ruifeng Xu†. PiKGL: Leveraging Pruned Knowledge Graphs for Explainable Stance Detection. TACL 2025
Bin Liang, Ang Li, Jingqian Zhao, Lin Gui, Min Yang, Yue Yu, Kam-Fai Wong and Ruifeng Xu. Multi-modal Stance Detection: New Datasets and Model. ACL 2024
Bingbing Wang, Zhixin Bai, Qianlong Wang, Jingjie Lin, Min Yang, Xi Zeng, Ruifeng Xu*l. More Than Just A Conversation: A Multi-agent Reasoning Graph Knowledge Distillation for Conversational Stance Detection. SIGIR 2025
立场检测是自然语言处理领域的一项基础任务,旨在判断文本作者对特定主题或目标所表达的态度(支持、反对或中立)。现有方法常借助维基百科等外部知识源补充目标相关背景知识以提升模型性能,但这类方法存在显著局限:其引入的知识多为概念性定义内容,未能挖掘知识本身的可解释性潜力,无法为立场预测提供可追溯的推理依据,同时因缺乏有效的知识筛选机制,易纳入与任务无关或冗余的信息,从而降低立场检测性能。为解决这一挑战,本文提出剪枝式可解释知识图谱学习框架。具体而言,该框架首先从文本和目标中提取事件三元组与主题,结合GDELT数据库获取真实世界的事件感知知识,并通过开放信息抽取和度数优先图连接机制构建可解释知识图谱。随后引入融合常识知识的检索引导剪枝策略,过滤知识图谱中的冗余信息,确保其精准性与目标相关性。最后将剪枝后的知识图谱注入大型语言模型,实现文本、目标与常识知识的联合建模,以提升立场理解能力。在三个公开数据集上的实验结果表明,该框架在目标内立场检测和零样本立场检测任务中均取得了当前最优性能。消融实验验证了知识图谱构建、剪枝机制等核心组件的有效性。
对话立场检测任务旨在识别社交媒体中用户评论的立场。在实际情境下,随着对话轮次不断增多,对话内容愈发复杂,仅依靠简单引入对话上下文的现有方法,已难以有效捕捉到实现精确立场检测所必需的细粒度信息。为了解决这一问题,本文提出了一种多智能体推理图知识蒸馏框架,将多个大语言模型的对话推理能力蒸馏至较小的语言模型中。具体而言,本文首先构建了一个多智能体推理图,从多个大模型的不同视角推理对话历史中隐含的逻辑关系。为充分利用大模型的上下文学习能力,本框架中设计了一种推理知识编辑机制,使得小模型在输出分布上对齐于对话历史以及推理图中提取的知识,从而内化新信息。此外,本框架引入了对比损失函数,以区分正确与错误的推理结果,同时结合立场检测损失,共同作用于语言模型的微调过程。该方法不仅确保了逻辑知识的准确获取,也保持了对话历史信息的完整性。在公开对话立场检测数据集上的实验结果表明,本框架显著提升了小模型的性能,全面优于现有的各类基线模型。
多模态立场检测进一步拓展了传统立场检测的边界,通过整合文本、图像等多源模态信息,全面判断用户对事件、政策、人物等目标的态度倾向,现有方法采用固定模态融合策略,忽视了单模态信息量的上下文依赖性及模态间语义关系的动态性,易因低质量模态信息污染检测过程,为此该研究受人类双加工认知理论启发,提出 ReMoD 框架,通过多模态知识感知模块提取文本(结合维基百科知识)和图像(经实体分割)的细粒度知识与特征,再经经验驱动直觉推理从模态经验池和语义经验池检索历史经验生成初始立场假设,最后通过审慎反思推理的两条思维链(模态思维链动态调整模态权重、语义思维链深化语义理解)更新经验池,实现模态贡献的动态权衡。在基准数据集上的实验表明,本方法在目标内和零样本场景下均显著优于纯文本、纯视觉及多模态等基线模型,消融实验验证了各模块的关键作用,不同骨干模型和检索阈值的实验进一步证明了其鲁棒性与泛化能力。