形近字错误数据集1-500(用于中文纠错形近字词错误的混淆集构建)

一个形近字数据集,因为是个人业余时间一个一个从实际场景中发现后构建,目前数据量还很小,但构建混淆集质量高。积累一定数量后会陆续更新。可用于研究及商业用途但请注明出处及作者李贝贝。
大家有相关数据也可一块构建,个人的力量太渺小了哈
形近字错误1-500.zip (17.8 KB)

3 Likes