hanlp2.1语义角色标注

在使用hanlp2.1的过程中,发现里面有一个疑惑,跟大家分享一下:
使用hanlp.load(hanlp.pretrained.mtl.CLOSE_TOK_POS_NER_SRL_DEP_SDP_CON_ELECTRA_SMALL_ZH)做分析的时候发现,如果加入自定义词典的话语义角色标注标注的结果和不使用词典的结果差距较大,而且自我感觉不使用自定义词典的结果更符合整句话的实事者与受事者的承受关系;加上词典会强制把一些词分到一起,以至于打乱了原来语义角色标注。不知道这样理解会不会有偏颇,求指教

原语义依存语料库的分词标准与细分标准类似,于是效果好一些。自定义词典强制将一些词合并到一起,embeddings平均后变得四不像,效果自然有可能变差。

1 Like

hanlp2.1 怎么加入自定义词典,谢谢?

HanLP = hanlp.load(hanlp.pretrained.mtl.CLOSE_TOK_POS_NER_SRL_DEP_SDP_CON_ELECTRA_SMALL_ZH)
tok = HanLP['tok/fine']
tok.dict_combine = custom_vocab

我是通过上面的方式添加自定义词典的

1 Like

custom_vocab 是什么格式?