看到腾讯AI实验室的开源词库,分享给大家,希望对大家有所帮助!
该语料库为超过800万个中文单词和短语提供了200维矢量表示(也称为嵌入),这些单词和短语已在大规模高质量数据上进行了预训练。
贴上链接:
https://ai.tencent.com/ailab/nlp/en/index.html
https://ai.tencent.com/ailab/nlp/en/embedding.html
先截图给大家,语料库的下载链接。(可下载链接: https://ai.tencent.com/ailab/nlp/en/data/Tencent_AILab_ChineseEmbedding.tar.gz )