请问一下,关于中文分句有哪些好的算法吗

在机器翻译等一些任务中,有时候需要对长的句子进行分句,之前的做法是:

  1. 根据token的个数。但是这样会导致有些句子的翻译效果很差。
  2. 根据终止符号(。)分割句子,但是有时候这样操作之后句子依然很长。