(二)新词发现基于信息熵和詞的凝合度算法(无预定义词库)
(四)语言模型进行无监督分词从而进行新词发现
(五)基于凝合度+语言模型的新词发现算法
本文在文獻(三)和(四)的基础上提出将两者优点相结合的方法进行新词发现。最后在微信300万篇文章中构建词库并取得了较好的效果
版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。
点击添加站长微信