如何在pipeline中使用output span?

你好,我有一个tok模型和一个pos模型组成的pipeline,设置output_span=True会报错(因为span的结果直接放在了tok的输出中被喂入pos,产生错误),请问是否有解决办法?

当然如果不使用pipeline的话是可以的,只不过就无法利用pipeline的加速了。

不过我测了一下似乎pipeline没有明显加速?是不是pipeline并没有设计流式加速(每个若干chunk_size就送入下一步处理,而不必等全部结果处理完毕再送入下一步)?