求教,短文本的相似性对比功能如何做?
HanLP
zhumer
November 7, 2019, 3:30pm
#1
我现在使用了编辑距离和SimHash算法计算短文本的相似度判断,但是发现针对短文本准确度一般般,请问有没有推荐的其他算法可用啊?
hankcs
November 8, 2019, 5:18am
#2
现成的可参考
word2vec
。tf也有个语言模型。
1 Like
zhumer
November 8, 2019, 7:39am
#3
好的,我先测试一下