(二)新词发现基于信息熵和詞的凝合度算法(无预定义词库)
(四)语言模型进行无监督分词从而进行新词发现
(五)基于凝合度+语言模型的新词发现算法
本文在文獻(三)和(四)的基础上提出将两者优点相结合的方法进行新词发现。最后在微信300万篇文章中构建词库并取得了较好的效果