从企业经营范围到行业建模研究 之二 预处理数据概况

从企业经营范围到行业建模研究 之二 预处理数据概况
介绍了用PyArrow+Dask+Parquet在笔记本有限的资源上分析处理体量比较大的HanLP分词、词性标注、短语句法分析、语义角色分析的结果。