本Discourse论坛启用了HanLP全文检索搜索引擎,请多加利用

Discourse内置的中文搜索功能效果非常差,经常出现搜索不到的情况。看了看源码,原来用的是结巴分词,怪不得这么差劲,几乎没法用。作为NLP论坛和NLP工程师,我们很关注搜索体验。为此,我们将论坛的搜索功能升级为HanLP+ElasticSearch,欢迎大家多多使用。升级前后的对比如下:

这是结巴分词的搜索结果

2020-02-16_00-01-37

现在是HanLP的搜索结果

2020-02-16_00-05-05

使用到的开源项目

3 Likes

现在HanLP搜索只发生在弹出列表里面,如果点击“更多”还是会跳转到默认的搜索页。默认的搜索页用的还是结巴,希望未来也可以替换掉。

1 Like

最近把elasticsearch插件升级了一下,加了加高亮,优化了段落拆分策略。效果如下:

2 Likes

这个感觉不错,可试一试。

如果有任何效果问题,欢迎跟帖,谢谢