2015年8月,研究组博士生陈涛的论文《A Gloss Composition and Context Clustering Based Distributed Word Sense Representation Model》在《Entroy》期刊发表。

本文针对传统基于聚类的词义向量生成方法的不足,提出了一种词义复合与聚类相结合的分布式词义向量表示模型。该模型首先利用卷积神经网络对WordNet中的词的定义进行复合生成初始词义向量,然后通过改进的Multi-Sense Skip-Gram (MSSG)模型对词义向量进行优化。该模型在两个词语相似度排序数据集、微软词语类比推理任务WordRep以及词义情感分类任务上都取得了较好的成绩。
《Entroy》期刊由MDPI出版,SCI影响因子1.502。
论文链接:http://www.mdpi.com/1099-4300/17/9/6007