课程名称:计算语言学概论     教师:詹卫东            返回主页

电子邮件:zwd@pku.edu.cn    电话:62765810 (办公室)    
有关本课程的任何问题和建议,都欢迎与我联系     

课程讲义下载. 

序号 内容提要   讲义下载(文件格式:pdf) 参考资料
1 前言, 课程安排, 参考文献,等等.
课程安排

课程知识要点汇总

期末报告选题及要求
2 第1讲

什么是计算语言学?

Chapter 1 绪论

大语言模型语言能力测试&语言学知识能力测试(2023_03_01)

  

《翻译》备忘录(Weaver,1949)

Computing Machinery and Intelligence(Turing, 《Mind》,1950)

  Elizapaper,1966)  

Loebner Prize for AI (Turing Test)

IBM Watson与人对决智力问答 (2011)

计算语言学与中文信息处理近年来发展综述(2004-2008)

自然语言处理的支撑科学是什么?(2009)

A Pendulum Swung Too Far by Kenneth Church(2011)

语言学知识:结构化、形式化、数据化、可视化(2018)  

3 第2讲

语言知识的形式化表达, 形式语言, 自动机/有限状态转移网络, 特征结构, 合一 

Chapter_2 语言知识的形式化表达

第2讲补充材料

第一次作业:构造汉语自然数表达式的形式文法   作业要求

附1:对CFG规则集进行分析的Python程序

附2:基于合一的自然数表达式分析程序

4 第3讲

汉语短语结构语法体系,上下文无关文法+合一约束

基于形式文法对汉语短语结构歧义的系统分析

Chapter 3 汉语的句法规则系统

句法结构歧义的类型及歧义消解

形式语法理论体系概观

句法结构树表示的四要素

第二次作业:汉语句法结构歧义的分析

附:歧义格式统计程序

5 第4讲


语义知识的表示

Chapter 4 语义知识的类型及其应用

第4讲补充材料
更多语义现象示例

语义知识库简介  综述文章
6 第5讲

语篇知识的表示 

Chapter 5 语篇知识及其应用
7 第6讲

语料库的构建与应用 

Chapter_6 语料库的构建及其应用

中文树库 

条件概率

N-gram

动态规划

最小编辑距离算法

示例程序

近30年来中文语言知识资源发展及应用
《语言战略研究》2018年第4期,58-69页


8 第7讲

中文词法分析

Chapter 7 中文自动分词

中文自动词性标注

词义标注(WSD)

构式视角下的汉语词类范畴再认识
9 第8讲

中文句法分析

Chapter 8 句法分析

左角分析算法

ATN分析算法

Chart分析算法

CYK 分析算法

Earley分析算法

GLR分析算法

带合一约束的Earley分析算法

 
10 第9讲

机器翻译
Chapter 9 机器翻译

 

 

致谢:

北大计算语言所俞士汶教授, 常宝宝博士,于江生博士,孙斌博士,胡俊峰博士,张化瑞博士  

中科院计算所刘群研究员,王斌研究员,白硕研究员 

清华大学周强博士,刘颖博士

感谢他们为本课程提供的资料与帮助