探讨下实现文本语法/语义完整性的可能

比方说,有下面的一段文本:

HanLP具备功能完善、精度准确、性能高效、语料
时新、架构清晰、可自定义的特点。

中间被截断了。
那么,我们需要检测,第一行是完整的一句话,还是两行合并起来才是完整的一句话。

有时,问题可能更加复杂:一句话被拆开后,并不是连续的两行。需要随机的拼接起两行,来进行检测。

有什么现行办法,或者怎么训练一个模型来做到?

居然在这里看到你了 灿灿