比方说,有下面的一段文本:
HanLP具备功能完善、精度准确、性能高效、语料
时新、架构清晰、可自定义的特点。
中间被截断了。
那么,我们需要检测,第一行是完整的一句话,还是两行合并起来才是完整的一句话。
有时,问题可能更加复杂:一句话被拆开后,并不是连续的两行。需要随机的拼接起两行,来进行检测。
有什么现行办法,或者怎么训练一个模型来做到?
比方说,有下面的一段文本:
HanLP具备功能完善、精度准确、性能高效、语料
时新、架构清晰、可自定义的特点。
中间被截断了。
那么,我们需要检测,第一行是完整的一句话,还是两行合并起来才是完整的一句话。
有时,问题可能更加复杂:一句话被拆开后,并不是连续的两行。需要随机的拼接起两行,来进行检测。
有什么现行办法,或者怎么训练一个模型来做到?
居然在这里看到你了 灿灿