北京大学CCL语料库简介

语料库网址: http://ccl.pku.edu.cn:8080/ccl_corpus 

CCL语料库及其检索系统为纯学术非盈利性的。不得将CCL语料库检索系统及其产生的检索结果用于任何商业目的。CCL不承担由此产生 的一切后果。

CCL语料库仅供语言研究参考之用。语 料本身的正确性需要您自己加以核实

CCL语料库中的中文文本未经分词处理。 检索系统以汉字为基本单位

使 用说明

   建议在使用CCL语料库之前,仔细阅读“CCL语料库使用说明” :pdf版本html版本    

   主要功能特色:

语 料库规模与分布 

如何引用CCL语料库?

中文

詹卫东、郭锐、谌贻荣,2003,北京大学中国语言学研究中心CCL语料库(规模:7亿字;时间:公元前11世纪-当代),网址: http://ccl.pku.edu.cn:8080/ccl_corpus

English

ZHAN, Weidong, GUO, Rui, CHEN, Yirong, 2003, The CCL Corpus of Chinese Texts: 700 million Chinese Characters, the 11th Century B.C. - present, Available online at the website of Center for Chinese Linguistics (abbreviated as CCL) of Peking University, http://ccl.pku.edu.cn:8080/ccl_corpus