Corpus


Topic Replies Activity
语料库资源全部迁入了自建网盘

Corpus版块原有的百度云上的语料库资源,现在全部迁入了自建网盘。原因一方面是百度云糟糕的用户体验以及道德原因,另一方面则是强调语料的研究性质、将用途限定于NLP研究者的小圈子。如果你是一名NLP研究者的话,一定能通过在论坛上活跃地讨论问题和帮助别人来获取到这些谢礼。如果你只是急着找些语料库商用(禁止行为)的话,也许你并不适合蝴蝶效应这个社区。 我分享的语料资源都是研究用途,禁止二次发布。不过本版块欢迎大家分享自己的语料库,以任何你…

2 April 26, 2020
About Corpus 1 October 15, 2019
百度百科100G语料563万词条分享 18 May 24, 2020
千万级巨型汉语词库分享 9 May 6, 2020
【微博语料第一弹】2000万条微博语料weibo_2019-05-18_10.30.41 8 April 23, 2020
❤️Emotional Frist Aid Dataset, 心理咨询问答语料库 1 April 23, 2020
【微博语料第五弹】2000万条微博语料weibo_2019-05-22_05.43.48 15 April 12, 2020
【微博语料第二弹】2000万条微博语料weibo_2019-05-19_12.10.38 2 March 22, 2020
关于自定义领域语料库 命名实体标注的问题 2 March 10, 2020
Hanlp1.x的large语料有提供么 1 March 7, 2020
中文依存树库训练计划 4 February 29, 2020
63万多条上海及周边地名 8 February 27, 2020
Cannot open http://file.hankcs.com/corpus/ 3 February 15, 2020
pku98的完整语料库在哪里可以下载 2 December 10, 2019
import com.hankcs.hanlp.corpus.MSR; 5 December 2, 2019
“原子”因果常识图谱 1 November 18, 2019
【微博语料第四弹】2000万条微博语料weibo_2019-05-21_15.26.17 1 October 23, 2019
【微博语料第三弹】2000万条微博语料weibo_2019-05-20_01.59.48 1 October 22, 2019
哈哈恭喜HanLP 发书了 已经购买了~~ 最近在研究实体抽取,整了一个纯NER的语料 训练出现问题 应该是语料格式问题 5 October 18, 2019
Chinese Treebank 8.0 (CTB8.0)下载 1 October 15, 2019