2015年6月10日,研究组博士生陈涛的论文《Improving Distributed Representation of Word Sense via WordNet Gloss Composition and Context Clustering》获计算语言学顶级会议The 53rd Annual Meeting of the Association for Computational Linguistics and the 7th International Joint Conference on Natural Language Processing (ACL-IJCNLP 2015)录用为短文,并受邀在会议上做Oral报告。
本文针对传统基于聚类的词义向量生成方法需要设定固定的词义数量和聚类参数以及初始向量对聚类结果影响较大的问题,提出利用卷积神经网络对WordNet中的词的定义进行复合生成初始词义向量,利用上下文聚类优化词义向量的方法。该方法在词语相似度和类比推理任务的多个子任务中取得了优于其他模型的成绩。
ACL是Association for Computational Linguistics年会,为计算语言学和自然语言处理领域排名第一的顶级会议,至今已经举行53届。
论文链接 : http://www.aclweb.org/anthology/P/P15/P15-2003.pdf