网页版本的词法分析是使用的什么模型?

您好,麻烦问下您,网页版本的词法分析是使用的哪个模型呢?我测试了感知机、CRF和HMM的模型发现一些词法分析结果都没有网页版本的理想。数据集用的是直接down下来的data数据集。
十分感谢。

《提问的智慧》。先搜索。