千万级巨型汉语词库分享

原文链接: https://www.hankcs.com/nlp/corpus/tens-of-millions-of-giant-chinese-word-library-share.html

算法+语料≈NLP这是一个六千万词汇量的分类词库,做HanLP这么久,我逐渐体会到,算法无法解决所有问题,词库…

下载地址:https://bbs.hankcs.com/t/topic/1457
解压密码:www.hankcs.com
准入条件信任等级Lv2,仅限核心NLP研究人员内部研究用途

4 Likes

pan.hankcs.com 域名无法解析,下载不了。

原下载地址永久作废,新的下载地址是 https://bbs.hankcs.com/t/topic/1457 。需要信任等级Lv2的研究者才能访问,没有账号的路人不必为了下载专门注册账号。新账号的信任等级是Lv0,这份谢礼不是为路人准备的,蝴蝶效应不想做成自私自利的社区。我在思考要不要限制注册,改成邀请制。目前论坛的氛围稍稍低于预期,我希望通过这份谢礼促进用户间的互相帮助。我不知道改成只能用edu邮箱注册会不会好一些,或者只能通过GitHub登录之类。老师、学生和开源项目的参与者才是蝴蝶效应理想的用户群。

2 Likes

image

什么鬼???

大家多预览各种问题互相给与帮助,就可以成长到L2了

2 Likes

感谢分享!:+1::+1::+1:

慢慢摸索中前进!

下载不了。。。

买了书也不行么 其实没太看明白怎么才能下载 而且这里面是没用词性的 只有词对吧