UD2.10数据集训练分词模型

要用UD2.10数据集训练分词模型,需要将数据集处理成CTB8_CWS_TRAIN这种形式吗?每一行是一句用空格隔开的token?能给一个数据处理的demo吗?