2026-05-15 14:06:52 报道 hamburger
北京大学CCL2026版语料库检索系统正式上线
2026年5月,北京大学中国语言学研究中心CCL2026版语料库检索系统上线运行。
CCL2026版语料库面向语言学、中文信息处理、语言教学及相关人文社会科学研究提供公益性、学术性语料检索服务。网址为:https://cclcorpus.pku.edu.cn/
北京大学CCL语料库由北京大学中国语言学研究中心开发和建设,是国内最早可通过互联网访问的大规模汉语语料库。自2004年第一个版本发布以来,CCL语料库历经多次扩充与功能更新:2004版总规模约1亿字符,2014版达到7.8亿字符,2024版扩充至58.4亿字符。此次上线的2026版总规模达到142亿字符。2026版系统新增了汉语中介语语料库,收录二语学习者汉语语料及其订正后语料(规模约259万字符),可为二语习得、汉语国际教育、学习者语言分析和偏误研究提供新的数据支持。
CCL2026版系统中,现代汉语语料库下设通用语料、专项语料、网络语料三个大类,便于用户根据研究对象选择不同来源和类型的现代汉语材料;古代汉语语料库下设断代语料、四库全书、佛道典籍、大型丛书四个大类;支持用户基于年代、文体领域等多维度检索。
参考资料:
CCL2026版系统规模简介:https://cclcorpus.pku.edu.cn/introduction
CCL2026版系统使用说明:https://cclcorpus.pku.edu.cn/help
CCL语料库得到的帮助情况简介:https://cclcorpus.pku.edu.cn/acknowledgement
阅读 70
返回
北京大学中文系
|
北京大学中文系图书馆
|
北京大学计算语言所
|
北京大学中文系应用语言学专业
地址:北京大学校内老化学楼二层 |
通信地址:北京大学中国语言学研究中心 |
邮编:100871
电子邮箱:hyyjzx@pku.edu.cn |
固定电话:86-10-62761276
© CCL of Peking University