香港科技大学中国语言学研究中心粤语数据库上线

香港科技大学中国语言学研究中心敬告诸位同行,早期粤语口语文献数据库(Early Cantonese Colloquial Texts: A Database) 早期粤语标注语料库(Early Cantonese Tagged Database) 已上载到互联网上,供同行学者使用。两项语料库由香港特别行政区研究资助局资助,分别由张洪年教授和姚玉敏教授建立。建库目的在于将一批珍贵的早期粤语口语数据电子化,以便学者有效并准确地撷取相关数据,利用充实的语言材料,进行研究,提出论点。同时,语料库的设计可以为日后开发者提供参考。

 早期粤语口语文献数据库属下列香港特别行政区研究资助局研究项目成果之一:《近代粤语的演变——早期广东话口语材料研究》
(The Cantonese Language: Its Past as Reconstructed from Early Colloquial Texts;负责人:张洪年;项目编号:HKUST/CUHK6055/02H)。库中最早印制的语料是Robert Morrison (1828) Vocabulary of the Canton Dialect,最晚出版的是D. Ball (1924) Cantonese Made Easy7种语料。使用者可按汉字或现代粤音和中古音检索。本数据库对早期粤语研究,可提供极大的帮助。 

 早期粤语标注语料库属下列香港特别行政区研究资助局研究项目成果之一:《早期粤语中跟趋向词有关的语义延伸及词序变化》(Directional Verbs in Early Cantonese Colloquial Texts: A Study of Metaphorical Extension and Word Order Change;负责人:姚玉敏;项目编号:644608)库中最早出版的语料是 (1872)《马可传福音书(广东土白)》,最晚出版的是A. Fulton (1931) Progressive and Idiomatic Sentences in Cantonese Colloquial,共10项语料。使用者可按汉字或词类标注检索。数据库对早期粤语语法方面的研究十分有用。 

 上述两个语料库共包含12项早期粤语口语资料,超过200,000字。学者可透过香港科技大学中国语言学研究中心的网页:http://ccl.ust.hk/ (Useful Resources) 登入。也可以从以下网址直接登入:http://pvs0001.ust.hk/Candbase/ (早期粤语口语文献数据库)http://pvs0001.ust.hk/WTagging/ (早期粤语标注语料库)


香港科技大学中国语言学研究中心在2003年成立。中心的宗旨是推动以历史演变为切入点、着重理论和实践的中国语言研究。《中国语言学集刊》由本中心和成立于美国西雅图的纪念李方桂先生中国语言学研究学会共同出版,刊载中国语言学方面特别是历史比较及方言研究的论文,汉藏语和其他跟汉语相关语言的研究亦在本刊旨趣之内。有关本中心的资料,请浏览以下网页:http://ccl.ust.hk/index.html

 

 


发布者:wangfeng

发布时间:2013-5-22 20:05:42

返回