请教HanLP1.X分词问题

HanLP版本

1.3.4

有问题的句子

现在申购也是需要等到180天后 才能赎回吗

分词代码

Segment segment = HanLP.newSegment().enableNameRecognize(false);
List termList = segment.seg(“现在申购也是需要等到180天后 才能赎回吗”.toLowerCase());
System.out.println(termList);

实际结果

[现在/t, 申购/vn, 也/d, 是/vshi, 需要/v, 等到/v, 180/m, 天后/nz, /w, 才能/n, 赎回/vn, 吗/y]

期望结果

[现在/t, 申购/vn, 也/d, 是/vshi, 需要/v, 等到/v, 180/m, 天,后, /w, 才能/n, 赎回/vn, 吗/y]

请问这种问题如何解决?天后是一个词,但在之前有数量词时,不应该分词为一个词

这种问题可以通过调整bigram模型校正:

具体原理欢迎参考《自然语言处理入门》

好的,感谢,我回去看下原理,之前买了这本书,还没有看 :sweat_smile: