在看书中字典树数据结构时,想到了Lucene中的FST,但是对于FST理解也不是太深,在此请各位说说自己的见解。或者和书中的数据结构做一个对比也行,谢谢了;
这个是在网是找的一个图:
没用过Lucene的FST。
从Theory of Computing的角度讲,HanLP中的各种trie都是FSA,定义了一个语言。而FST定义了语言之间的关系,比如英文单词到词素的映射。FST常用于英文词素提取,在中文可能没有什么应用。
没用过Lucene的FST。
从Theory of Computing的角度讲,HanLP中的各种trie都是FSA,定义了一个语言。而FST定义了语言之间的关系,比如英文单词到词素的映射。FST常用于英文词素提取,在中文可能没有什么应用。