在 HanLP 2.x 中添加自定义词典

在 HanLP 2.x 中,可以添加自定义词典,但是自定义的词没法定义其词性。比如“南方的小沙糖桔”这个词我想要给他的词性定义为“2024_hot_word”,该怎么做?感谢大佬解答

我使用ner.dict_whitelist = {‘南方的小沙糖桔’: ‘2024_hot_word’},你可以参考下哈

多谢哈,这样可以的

不客气,这块我也一直在研究如何使用,欢迎互相探讨下哈

请问大家有更优选的方式吗,如果有大量的词要写入,会很不美观

您好,这也是困扰我的地方,目前我大数据按这样的方式加的话,内存基本爆了,所以无奈只能选择考虑微调模型了,1.84是很容易简单的添加的,我也一直在找是否2.1也有这样的功能,欢迎一起来讨论下

你好,看你用过1.x,有个问题想问下
NLP分词针对文本:
天龙八部.txt 《天龙八部》
最终结果:
[天龙八部.txt 《天龙八部/n, 》/w]
这种情况有处理过么,官方那个在线的对比1.x结果和我本地的完全不一样


试了好多办法都不太行,中间加换行竟然会把换行也分到词里面
加换行:

[天龙八部.txt 
《天龙八部/n, 》/w]