感谢反馈。目前的模型使用的训练语料使用了商品评价数据,对于其他领域可能效果有所下降。比如你的例子中,“蹭”与“该商品蹭热度”近似,“狂吸80亿”可能让模型联想到“某老板狂吸多少亿后跑路”。即使让人类看,这个句子使用了负面情感较强的“蹭”“狂吸”作为主要的动词,不能说属于正面的。也可能简体中文圈的现代人对这两个词的理解稍有不同,我发现社交媒体上的现代中国人喜欢使用一些感情强烈的负面词汇引起关注,这点模型暂未理解。
你可以如下实验来验证我的观点:
- 将“蹭”替换为“拍”:半个朋友圈都在拍的樱花,狂吸80亿
- 进一步明确告诉模型80亿指的是播放量:半个朋友圈都在拍的樱花,狂吸80亿播放量
- 将“狂吸”替换为“吸引”:半个朋友圈都在拍的樱花,吸引80亿播放量
你会发现情感极性是逐步往正面上升的,特别是第二步正负情感恰好抵消,让我觉得该模型是比较公平准确的。
1 Like