课程名称:计算语言学概论  & amp; amp; amp; nbsp; 詹卫东            返回主页

电子邮件:zwd@pku.edu.cn    电话:62765810 (办公室)    
有关本课程的任何问题和建议,都欢迎与我联系     更多 与课程相关的资料  

课程讲义下载.  (请 使用Acrobat Reader阅读)   

序 号 & nbsp;内容提要  讲义下载(文件格式:pdf) 参考资料
1 前言, 课程安排, 参考文献, 等等. 课程安排  
2 第1讲

什么是计算语言学?

Chapter 1 绪论  

Elizapaper 1966) 

Loebner Prize for AI (Turing Test)

机器人写稿子

IBM Watson与人对决智力问答 (2011)

……

计算语言学与中文 信息处理近年来发展综述(2004-2008) 

自 然语言处理的支撑科学是什么?(2009)

A Pendulum Swung Too Far by Kenneth Church (2011)

 

3 第2讲

语言知识的形式化表达, 形式语言, 自动机/有限状态转移网络, 特征结构, 合一 

Chapter_2 语言知识的形式化表达 把字结构与被字结构的变换

有 限状态自动机示例

第一次作业:构造汉语自然数表达式的形式文法  作业要求

附1:对CFG规则集进行分析的Python程 序

附2:基于合一的自然数表达式 分析程序

4 第3讲

汉语短语结构语法体系,上下文无关文法+合一 约束

基于形式文法 对汉语短语结构歧义的系统分析

Chapter 3 汉语的句法规则系统

句 法结构歧义的类型及歧义消解

形式语法理论体系概观

5 第4讲


语义知识的表示

Chapter 4 语义知识的类型及其应用
6 第5讲

语篇知识的表示 

Chapter 5 语篇知识及其应用
7 第6讲

语料库的构建与应用 

Chapter_6 语料库的构建及其应用

中文树库 
8 第7讲

中文词法分析

Chapter 7 中文自动分词

中 文自动词性标注

9 第8讲

中文句法分析

Chapter 8 句法分析

左角分析算法

ATN分析算法

Chart分析算法

CYK 分析算法

Earley 分析算法

GLR 分析算法

带合一约束的Earley分析算法

 
10 第9讲

机器翻译
Chapter 9 机器翻译 期 末报告

 

 

致谢:

北大计算语言所俞士汶教授, 常宝宝博士,于江生博士,孙斌博士,胡俊峰博士,张化瑞博士  

中科院计算所刘群研究员,王斌研究员,白硕研究员 

清华大学周强博士,刘颖博士

感谢他们为本课程提供的资料与帮助