
EMNLP 2021(The 2021 Conference on Empirical Methods in Natural Language Processing)将于2021年11月7日至11日以在线会议的形式举办,EMNLP是自然语言处理领域的国际顶级学术会议,在中国计算机学会推荐会议列表为B类会议,由ACL SIGDAT(语言学数据特殊兴趣小组)主办。
研究团队共有6篇论文被录用,其中4篇被主会录用,2篇被Findings of EMNLP录用。
题目:Beta Distribution Guided Aspect-aware Graph for Aspect Category Sentiment Analysis with Affective Knowledge
作者:梁斌,苏航,殷熔磾,桂林,杨敏,赵琴,俞晓琪,徐睿峰
录用类别:主会
简介:我们在这个工作中提出了一种结合beta分布的图网络模型用于解决aspect category情感分类问题。在该任务中,因为aspect category通常不会显式出现在上下文中。所以,我们基于beta分布的特性,在外部情感知识库中对aspect category的情感路径进行建模,从而获取每一个情感词语对相应aspect category的重要程度(权重)。基于此,我们将这些情感词和权重配对视作为一座桥梁,在aspect category不出现在句子中时也能构建相应的图结构。同时,这些情感词可以作为一种外部知识,直接可以用在已知的aspect category情感预测中。
我们将会在近期分享该论文和公布相关代码。
题目:Argument Pair Extraction with Mutual Guidance and Inter-sentence Relation Graph
作者:鲍建竹,梁斌,孙婧伊,张义策,杨敏,徐睿峰
录用类别:主会
简介:本文通过一个互指导的框架来解决论点对抽取任务,该框架可以利用一个段落中的论点信息来指导识别另一个段落中与之配对的论点。此外,我们提出了一个句子间关系图来有效地建模两个句子间的关系,从而有效增强论点对的抽取。总体来看,我们的方法可以更好地表示论点的整体语义信息,从而明确地捕捉论点对之间的复杂关联。
题目:Progressive Self-Training with Discriminator for Aspect Term Extraction
作者:王乾龙,温志渊,赵琴,杨敏,徐睿峰
录用类别:主会
简介:我们旨在缓解aspect extraction中标注数据不足的问题。虽然self-training可能是解决这个问题的有效方法,但它在未标记数据上产生的伪标签会引起噪音。本文中,我们使用两种方法来减轻伪标签中的噪声。一是在curriculum learning的启发下,我们将传统的self-training改进为progressive self-training。另一个是我们使用一个discriminator 来过滤嘈杂的伪标签。在四个 semeval 数据集上的实验结果表明,我们的模型显着优于以前的baseline模型。
题目:An Empirical Study on Multiple Information Sources for Zero-shot Fine-grained Entity Typing
作者:陈奕,蒋海云,刘乐茂,史树明,范创,杨敏,徐睿峰
录用类别:主会
简介:本文引入三种辅助信息来提升模型在细粒度实体分类上的零样本学习能力,包括上下文一致性、类型层次结构以及类型的背景知识,并针对这些信息源设计了一种多源融合模型(Multi-Source Fusion Model,MSF)。在BBN和Wiki两个数据集上的结果显示,对比现有基线模型,MSF的Macro-F1指标分别提升了11.42%和22.84%。在预测经过有监督训练的已知实体类型时,MSF也达到了同类模型的最佳性能。在此基础上,本文深入分析了不同信息源之间的互补性,以及它们在目标任务上表现出的特点、优势和不足,给未来工作提供了重要线索。
题目:Graph-based Event Structure Induction for Document-Level Causal Relation Identification
作者:范创,刘道兴,覃立波,党一学,张岳,徐睿峰
录用类别:Findings of EMNLP
简介:在本文中,我们提供了一个新的视角在事件级别研究因果关系。优点是:1)通过将事件建模为一个单元(包含多个事件实例),使得在没有任何额外约束的情况下,实例级别的预测结果不再有冲突;2)通过简单的启发式方法(例如,共现关系),构建出包含丰富信息的事件异构图,帮助模型进行事件级别的因果推理。结果表明,本文的方法在不同实验设置下均优于最先进的基线模型。
题目:Improving Empathetic Response Generation by Recognizing Emotion Cause in Conversations
作者:高俊, 刘宇翰, 邓浩霖, 王伟, 曹雨, 杜嘉晨,徐睿峰
录用类别:Findings of EMNLP
简介:目前有关同理心对话的工作大多采用预测情感标签以及根据相应的情感标签生成合适回复这样的框架。然而,作为同理心回复的基础要素,情感原因这一信息却被忽略。从心理学的角度,我们往往因为某些具体的原因而产生某种情感,因此有效识别出情感原因能更有利于理解情感以及生成更具有同理心的回复。从这个角度出发,我们提出了一个新型的同理心对话框架:通过识别对话中的情感原因来提高同理心回复的生成。具体的,一个情感推理器用于识别对话历史中的情感原因和对应的情感,然后我们设计了硬/软门控注意力机制来将情感原因的信息有效融入回复生成中。实验结果表明:结合情感原因信息可以在情感识别和回复生成两方面有效提高模型的性能。