2025年5月,研究团队博士生张晗的论文《An Orthogonality-based Dual-memory Framework for Continual Text Classification》获音频、语音与语言处理领域顶级国际期刊IEEE/ACM Transactions on Audio, Speech, and Language Processing录用。
持续文本分类在实际应用中扮演着重要的角色,其研究重点是对随时间不断涌现的新文本进行分类。尽管已有许多研究致力于克服持续学习(Continual Learning, CL)中的主要挑战—灾难性遗忘(Catastrophic Forgetting, CF),但现有的持续学习方法忽略了不同任务之间潜在的干扰,仍然面临灾难性遗忘问题。为了更深入地理解灾难性遗忘,本文首次尝试研究持续文本分类任务中遗忘现象与表示相似性之间的关系。对真实数据集和伪数据集进行的全面分析发现,对于基于预训练语言模型的方法,降低不同数据集表示之间的相似性可以有效缓解遗忘问题。基于这一发现,我们提出了一种新的基于正交性的对偶记忆框架(Orthogonalitybased Dual-memory Framework, Org-Frame),该框架通过一个类似于人类记忆系统的两阶段学习过程,能够最小化不同任务之间的干扰。此外,Org-Frame还可以与LoRA微调方法结合,增强预训练语言模型的持续学习能力。在BERT和LLaMA上进行的大规模基准实验表明,我们提出的框架在持续文本分类任务中具有良好的有效性与鲁棒性。
本文方法框架图
IEEE/ACM Transactions on Audio, Speech, and Language Processing(TASLP)是自然语言处理与语音计算领域的国际顶级期刊,由IEEE信号处理学会出版,涵盖音频技术、语音处理及语言计算三大方向。该刊2024年影响因子为4.1,位列JCR Q1分区,是中国计算机学会推荐的B类期刊、中国人工智能学会(CAAI)和清华推荐的A类期刊。
论文信息:
Han Zhang, Yu Lei, Bin Liang, Hui Wang, Lin Gui, and Ruifeng Xu. An Orthogonality-based Dual-memory Framework for Continual Text Classification. IEEE/ACM Transactions on Audio, Speech, and Language Processing. 2025.