求教,短文本的相似性对比功能如何做?

我现在使用了编辑距离和SimHash算法计算短文本的相似度判断,但是发现针对短文本准确度一般般,请问有没有推荐的其他算法可用啊?

现成的可参考word2vec。tf也有个语言模型。

1 Like

好的,我先测试一下