hanlp能否进行生语料的无监督学习?

带标注的语料比较难搞,hanlp能否基于不做标注的生语料进行无监督学习?

首先得说明任务才好判断能不能进行无监督学习吧

比如从网页之类文本中提取某些特定名词,比如地名、人名之类,可以提供大量未标注的生语料

那就是无监督的NER任务,可以试试用word2ve + tf-idf做一下,具体的你可以查查看