自定义词库中的词在提取关键词和实体名词的时候不能被抽取出来

我有一批文章,中间有5G这样的词,我把“5G”加入自定义词库中,可以正常分词,但是在抽取关键词和实体识别时,只能抽取到“G”,这种情况应该怎么办?

谢谢!

不知你用的hanlp版本是1.0还是2.0, 1.0应该可以在分词器中把enable ner给打开, 如果是2.0的话, 分词和ner是两个不同的任务, 你可以先进行分词, 然后进行ner, 然后将ner结果和分词结果进行合并。

1 Like

请教下2.0版本是否可以给NER task加自定义词语,还是说只能自己用语料继续训练呢?

你好,想问下做个然后将ner结果和分词结果进行合并具体是什么操作呢