二元语法训练模型

yelidong · November 9, 2019, 7:11am

trainBigram(MY_CWS_CORPUS_PATH, MY_MODEL_PATH);
Segment segment = loadBigram(MY_MODEL_PATH);
这段代码中的，语料是已经分好词的语料；
是不是大家都这样训练出来的分词器再去做分词呢？

ZhuaN · November 23, 2019, 6:13am

监督学习的训练语料都是预先标注好的，也就是已经分好词的语料。

yelidong · November 29, 2019, 6:47am

明白了，书本中是介绍了很多分词器训练的方法。谢谢。