昇腾npu和鲲鹏cpu上的运行速度

您好 ,有几个问题想要请教一下
问题1:以NER任务为例,能否在华为910b类似设备上进行推理,CANN
问题2:在鲲鹏Kunpeng-920型号CPU上推理速度特别慢,有什么优化思路吗。Ubuntu 22.04.4 LTS Architecture为aarch64

import hanlp
import torch
# import torch_npu
import torch.nn.functional as F
import time
HanLP = hanlp.load(hanlp.pretrained.mtl.CLOSE_TOK_POS_NER_SRL_DEP_SDP_CON_ELECTRA_BASE_ZH)
input = "务支撑以及问题处理-北京等4省问题跟进以及问题处理业务支撑以及问题处理-甘肃等5省问题跟进以及问题处理业务支撑以及问题处理-广东等3省问题跟进以及问题处理业务支撑以及问题处理-河北等3 省问题跟进以及问题处理业务支撑以及问题处理-江苏等4省问题跟进以及问题处理业务支撑以及问题处理-内蒙等5省问题跟进以及问题处理业务支撑以及问题处理-山东等3省问题跟进以及问题处理"
start_time = time.time()
doc = HanLP(input, tasks='ner/pku')
total_time = time.time() - start_time
print(f"Total time: {total_time:.2f}s")

Total time: 37.41s