千万级巨型汉语词库分享

原文链接: https://www.hankcs.com/nlp/corpus/tens-of-millions-of-giant-chinese-word-library-share.html

算法+语料≈NLP这是一个六千万词汇量的分类词库,做HanLP这么久,我逐渐体会到,算法无法解决所有问题,词库…

下载地址:https://bbs.hankcs.com/t/topic/1457
解压密码:www.hankcs.com
作为赠予信任等级Lv2 的谢礼,仅限NLP研究人员内部研究用途。请大家多多互帮互助,我们会准备更多谢礼给热心人士。

10 Likes

pan.hankcs.com 域名无法解析,下载不了。

原下载地址永久作废,新的下载地址是 https://bbs.hankcs.com/t/topic/1457 。需要信任等级Lv2的研究者才能访问,没有账号的路人不必为了下载专门注册账号。新账号的信任等级是Lv0,这份谢礼不是为路人准备的,蝴蝶效应不想做成自私自利的社区。我在思考要不要限制注册,改成邀请制。目前论坛的氛围稍稍低于预期,我希望通过这份谢礼促进用户间的互相帮助。我不知道改成只能用edu邮箱注册会不会好一些,或者只能通过GitHub登录之类。老师、学生和开源项目的参与者才是蝴蝶效应理想的用户群。

5 Likes

image

什么鬼???

大家多预览各种问题互相给与帮助,就可以成长到L2了

2 Likes

感谢分享!:+1::+1::+1:

慢慢摸索中前进!

下载不了。。。

买了书也不行么 其实没太看明白怎么才能下载 而且这里面是没用词性的 只有词对吧

1 Like

找了好久的词典终于在这里找到了

1 Like

感谢分享

1 Like

可以放低下载要求吗?

1 Like

很棒的语料库

1 Like

确实,不给买了书的送一份吗

1 Like

感谢各位读者的支持,让我再重申一遍:

  1. 书籍相关的语料全部都是正规研究机构公开的研究数据,“谢礼”语料与书籍无关
  2. “谢礼”的目的在于鼓励所有人(包括读者)互帮互助、参与开源、促进中文NLP发展
  3. 这些语料仅限学术目的、严禁参与商业活动。“买书送语料”不仅有违道义,更有可能违法!
1 Like

感谢分享

1 Like