Specify which annotation to use , 并没有打出 pku 的 词性

还有 Specify which annotation to use , 并没有打出 pku 的 词性

 HanLP: MultiTaskLearning = hanlp.load(hanlp.pretrained.mtl.OPEN_TOK_POS_NER_SRL_DEP_SDP_CON_ELECTRA_SMALL_ZH)
 ...
doc.pretty_print(ner='ner/ontonotes', pos='pku')

—pku—

2021年 HanLPv2.1 为 生产 环境 带来 次 世代 最 先进 的 多 语种 NLP 技术 。

up主 来到 北京 立方庭 参观 自然 语义 科技 公司 。

一个帖子一个问题,如果要提新问题,请单独开贴,方便后来人搜索。

每个组件的任务列表都不同,你必须先打印HanLP.tasks.keys()搞清楚这个组件支持什么任务。在pretty_print 的时候,你必须指定完整的任务名称。

HanLP: MultiTaskLearning = hanlp.load(hanlp.pretrained.mtl.OPEN_TOK_POS_NER_SRL_DEP_SDP_CON_ELECTRA_SMALL_ZH)
tasks = list(HanLP.tasks.keys())
print(tasks) # Pick what you need from what we have

打印结果

[‘con’, ‘dep’, ‘ner’, ‘pos’, ‘sdp’, ‘srl’, ‘tok’]

这是意味着 hanlp.pretrained.mtl.OPEN_TOK_POS_NER_SRL_DEP_SDP_CON_ELECTRA_SMALL_ZH

当中没有 pos/pku 任务吗? :face_with_raised_eyebrow:

没有,这个组件只有CTB规范。

那么包含
pos/pku
的任务从哪下载呢?还是要自行训练?还是目前只有restful版本支持?

你可以从这里找到所有的多任务组件名称:

以CLOSE开头的是闭源语料,都支持pku词性;以OPEN开头是开源的OntoNotes。作为一个开源项目,HanLP保证文档里的模型都是开源的。虽然由于版权限制我们无法开源CLOSE语料,但现有法律不妨碍我们开源相应的模型。

2 Likes

:+1: 明白 了。